DSpace About DSpace Software
 

IRZSMU >
Кафедри >
Кафедра технології ліків >
Наукові праці. (Технологія ліків) >

Please use this identifier to cite or link to this item: http://dspace.zsmu.edu.ua/handle/123456789/14414

Название: Використання методів машинного навчання в розробленні назальних лікарських форм церебропротективної дії
Другие названия: The use of machine learning methods in the development of nasal dosage forms with cerebroprotective action
Использование методов машинного обучения в разработке назальных лекарственных форм церебропротективного действия
Авторы: Бурлака, Богдан Сергійович
Бєленічев, Ігор Федорович
Burlaka, B. S.
Bielenichev, I. F.
Бурлака, Б. С.
Беленичев, И. Ф.
Ключевые слова: машинне навчання
лікарські форми
церебропротектори
machine learning
dosage forms
cerebroprotectors
машинное обучение
лекарственные формы
церебропротекторы
Issue Date: 2021
Издатель: Запорізький державний медичний університет
Библиографическое описание: Бурлака Б. С. Використання методів машинного навчання в розробленні назальних лікарських форм церебропротективної дії / Б. С. Бурлака, І. Ф. Бєленічев // Актуальні питання фармацевтичної і медичної науки та практики. – 2021. – Т. 14, №2(36). – С. 232-238. - DOI: 10.14739/2409-2932.2021.2.232053.
Аннотация: Для ресурсозбереження активних фармацевтичних інгредієнтів і допоміжних речовин на ранніх етапах дослідження під час планування експерименту доцільно використати знання щодо прогнозованих та експериментальних фізико-хімічних властивостей, що перебувають у різних агрегаційних базах даних. Знайдена інформація дає можливість скоротити час на розроблення складу та опрацювання технології. Але різноманіття характеристик активних сполук і допоміжних речовин не завжди наведене в названих сервісах. Останнім часом моделі машинного навчання, що дають можливість отримувати прогнозування з високою ймовірністю, широко застосовують у різних наукових напрямах. Отже, актуальним і перспективним є опрацювання моделей машинного навчання для прогнозу наявності фармацевтичних несумісностей у рецептурі назальних лікарських форм. Мета роботи – опрацювання моделей машинного навчання для in silico прогнозу раціонального складу назальних лікарських форм церебропротективної дії. Матеріали та методи. Як матеріал використовували датасет, що містив дані щодо сполук (діючих і допоміжних) і ознаки щодо наявності або відсутності взаємодії (фармацевтичної несумісності). Наповнення датасету для навчання (training datasets) здійснювали шляхом контент-аналізу даних бібліотеки PubMed (pubmed.ncbi.nlm.nih.gov) у ручному режимі за ключовими словами («pharmaceutical incompatibilites», «physico-chemical compatibility», «incompatible excipients») за останні 10 років. Обсяг датасету, що одержали, – 1185 рядків. Використали набір методів бінарної класифікації машинного навчання (pycaret.org) із застосуванням мови програмування python 3.8 (python.org) у середовищі управління пакетами miniconda (conda.io). Програмування пайплайну (pipeline) здійснили за допомогою пакета jupyter notebook (jupyter.org). Генерацію ознак сполук MACCS (Molecular ACCess System keys) у навчальному датасеті виконали за допомогою пакета RDKit (rdkit.org). Специфікації спрощеного наведення молекул у рядку введення (SMILES) в автоматичному режимі шукали за допомогою сервісу PubChem (pubchem.ncbi.nlm.nih.gov). Результати. У результаті дослідження обрали дві перспективні моделі машинного навчання бінарної класифікації, якість роботи яких перевіряли на датасеті для перевірки. Статистичне оцінювання обраних моделей свідчить про високу ймовірність in silico прогнозу щодо наявності або відсутності фармацевтичних несумісностей під час розроблення назальних рецептур церебропротективних лікарських форм і розміщення на вебсервері експертної системи ExpSys Nasalia (nasalia.zsmu.zp.ua) в розділі розрахунки. Висновки. Опрацювали моделі машинного навчання для in silico прогнозу раціонального складу назальних лікарських форм церебропротективної дії. Підтвердження якості прогнозу фармацевтичних несумісностей із використанням опрацьованих моделей виконали на датасеті для перевірки. Отримали статистичні показники моделей tree_blender (AUC 0.9521, F1 0.9747, MCC 0.9094), boost_blender (AUC 0.9593, F1 0.9821, MCC 0.9352). Використання моделей машинного навчання у фармацевтичній розробці сприятиме ресурсозбереженню та оптимізації складу рецептури. In order to save resource of active pharmaceutical ingredients and excipients, in the early stages of research, when planning an experiment, it is advisable to use data of the predicted and experimental physicochemical properties stored in different aggregation databases. The information found will reduce the time for composition development and for technology processing. However, the variety of active compounds characteristics and excipients is not always reflected in these services. Recently, machine learning models have been widely used in various scientific fields; they allow to obtain predictions with high reliability. Given the above, it is relevant and promising to develop models of machine learning to predict the presence of pharmaceutical incompatibilities in the formulation of nasal dosage forms. The aim of the study is to develop models of machine learning for in silico forecast of the rational composition of nasal dosage forms with cerebroprotective action. Materials and methods. A dataset, containing data on compounds (active and auxiliary) and characteristics on the presence or absence of interaction (pharmaceutical incompatibility), was used as material. Training datasets were filled by content analysis of PubMed library data (pubmed.ncbi.nlm.nih.gov) manually, by keywords “pharmaceutical incompatibilities”, “physico-chemical compatibility”, “incompatible excipients”) for the last 10 years. The resulting dataset comprises 1185 lines. The methods employed were a set of methods for binary classification of machine learning (pycaret.org) using the programming language Python 3.8 (python.org) in the package management environment Miniconda (conda.io). Pipeline programming was performed using Jupyter notebook package (jupyter.org). The generation of MACCS (Molecular ACCess System keys) in the training dataset was performed using RDKit package (rdkit.org). Specifications of the simplified representation of molecules in the input line (SMILES), in automatic mode, were searched using PubChem service (pubchem.ncbi.nlm.nih.gov). Results. The obtained data allowed to choose two perspective models of machine learning of binary classification, whose quality was checked on a dataset for verification. Statistical evaluations of the selected models indicate a high probability of in silico prognosis for the presence or absence of pharmaceutical incompatibilities in the development of nasal formulations of cerebroprotective dosage forms. They are posted on the web server of the expert system ExpSys Nasalia (nasalia.zsmu.zp.ua) in the calculations section. Conclusions. As a result of our research, we have developed machine learning models for in silico prediction of the rational composition of nasal dosage forms with cerebroprotective action. Confirmation of the quality of the pharmaceutical incompatibilities prediction, using the developed models, is checked on a dataset for check. The statistical indicators of the tree_blender (AUC 0.9521, F1 0.9747, MCC 0.9094) and boost_blender (AUC 0.9593, F1 0.9821, MCC 0.9352) models were obtained. The use of machine learning models in pharmaceutical development will contribute to resource conservation and optimization of the composition of the formulation. Для ресурсосбережения активных фармацевтических ингредиентов и вспомогательных веществ на ранних этапах исследования при планировании эксперимента целесообразно использовать данные по прогнозируемым и экспериментальным физико-химическим свойствам, которые находятся в разных агрегационных базах данных. Найденная информация позволит сократить время на разработку состава и обработки технологии. Однако многообразие характеристик активных соединений и вспомогательных веществ не всегда представлено в указанных сервисах. В последнее время модели машинного обучения широко применяют в различных научных направлениях и позволяют прогнозировать результат с высокой достоверностью. Таким образом, актуальна и перспективна разработка моделей машинного обучения для прогноза наличия фармацевтических несовместимостей в рецептуре назальных лекарственных форм. Цель работы – разработка моделей машинного обучения для in silico прогноза рационального состава назальных лекарственных форм церебропротективного действия. Материалы и методы. В качестве материала использовали датасет, содержащий данные соединений (действующих и вспомогательных) и признаки о наличии или отсутствии взаимодействия (фармацевтической несовместимости). Наполнение датасета для обучения (training datasets) осуществляли путем контент-анализа данных библиотеки PubMed (pubmed.ncbi.nlm.nih.gov) в ручном режиме по ключевым словам («pharmaceutical incompatibilites», «physico-chemical compatibility», «incompatible excipients») за последние 10 лет. Объём полученного датасета – 1185 строк. Использовали набор методов бинарной классификации машинного обучения (pycaret.org) с применением языка программирования python 3.8 (python.org) в среде управления пакетами miniconda (conda.io). Программирование пайплайна (pipeline) осуществляли с помощью пакета jupyter notebook (jupyter.org). Генерацию признаков соединений MACCS (Molecular ACCess System keys) в датасете для обучения проводили с помощью пакета RDKit (rdkit.org). Спецификации упрощенного представления молекул в строке ввода (SMILES) в автоматическом режиме искали с помощью сервиса PubChem (pubchem.ncbi.nlm.nih.gov). Результаты. В результате исследования выбрали две перспективные модели машинного обучения бинарной классификации, качество работы которых проверяли на датасете для проверки. Статистические оценки избранных моделей свидетельствуют о высокой вероятности in silico прогноза о наличии или отсутствии фармацевтических несовместимостей при разработке назальных рецептур церебропротективных лекарственных форм и размещены на веб-сервере экспертной системы ExpSys Nasalia (nasalia.zsmu.zp.ua) в разделе расчёты. Выводы. В результате исследований разработаны модели машинного обучения для in silico прогноза рационального состава назальных лекарственных форм церебропротективного действия. Подтверждение качества прогноза фармацевтических несовместимости с использованием обработанных моделей проведено на датасете для проверки. Получены статистические показатели моделей tree_blender (AUC 0,9521, F1 0,9747, MCC 0,9094), boost_blender (AUC 0,9593, F1 0,9821, MCC 0,9352). Использование моделей машинного обучения в фармацевтической разработке будет способствовать ресурсосохранению и оптимизации состава рецептуры.
Описание: Бурлака Б. С. - ORCID ID: 0000-0003-4539-7331; Бєленічев І. Ф. - ORCID ID: 0000-0003-1273-5314.
URI: http://dspace.zsmu.edu.ua/handle/123456789/14414
Appears in Collections:Наукові праці. (Фармакологія та МР)
Наукові праці. (Технологія ліків)

Files in This Item:

File Description SizeFormat
16.pdf2,96 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback