|
IRZSMU >
Кафедри >
Кафедра технології ліків >
Наукові праці. (Технологія ліків) >
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://dspace.zsmu.edu.ua/handle/123456789/14414
|
Название: | Використання методів машинного навчання в розробленні назальних лікарських форм церебропротективної дії |
Другие названия: | The use of machine learning methods in the development of nasal dosage forms with cerebroprotective action Использование методов машинного обучения в разработке назальных лекарственных форм церебропротективного действия |
Авторы: | Бурлака, Богдан Сергійович Бєленічев, Ігор Федорович Burlaka, B. S. Bielenichev, I. F. Бурлака, Б. С. Беленичев, И. Ф. |
Ключевые слова: | машинне навчання лікарські форми церебропротектори machine learning dosage forms cerebroprotectors машинное обучение лекарственные формы церебропротекторы |
Дата публикации: | 2021 |
Издатель: | Запорізький державний медичний університет |
Библиографическое описание: | Бурлака Б. С. Використання методів машинного навчання в розробленні назальних лікарських форм церебропротективної дії / Б. С. Бурлака, І. Ф. Бєленічев // Актуальні питання фармацевтичної і медичної науки та практики. – 2021. – Т. 14, №2(36). – С. 232-238. - DOI: 10.14739/2409-2932.2021.2.232053. |
Аннотация: | Для ресурсозбереження активних фармацевтичних інгредієнтів і допоміжних речовин на ранніх етапах дослідження під час планування експерименту доцільно використати знання щодо прогнозованих та експериментальних фізико-хімічних властивостей, що
перебувають у різних агрегаційних базах даних. Знайдена інформація дає можливість скоротити час на розроблення складу та
опрацювання технології. Але різноманіття характеристик активних сполук і допоміжних речовин не завжди наведене в названих
сервісах. Останнім часом моделі машинного навчання, що дають можливість отримувати прогнозування з високою ймовірністю,
широко застосовують у різних наукових напрямах. Отже, актуальним і перспективним є опрацювання моделей машинного навчання для прогнозу наявності фармацевтичних несумісностей у рецептурі назальних лікарських форм.
Мета роботи – опрацювання моделей машинного навчання для in silico прогнозу раціонального складу назальних лікарських
форм церебропротективної дії.
Матеріали та методи. Як матеріал використовували датасет, що містив дані щодо сполук (діючих і допоміжних) і ознаки щодо
наявності або відсутності взаємодії (фармацевтичної несумісності). Наповнення датасету для навчання (training datasets) здійснювали шляхом контент-аналізу даних бібліотеки PubMed (pubmed.ncbi.nlm.nih.gov) у ручному режимі за ключовими словами
(«pharmaceutical incompatibilites», «physico-chemical compatibility», «incompatible excipients») за останні 10 років. Обсяг датасету,
що одержали, – 1185 рядків. Використали набір методів бінарної класифікації машинного навчання (pycaret.org) із застосуванням
мови програмування python 3.8 (python.org) у середовищі управління пакетами miniconda (conda.io). Програмування пайплайну
(pipeline) здійснили за допомогою пакета jupyter notebook (jupyter.org). Генерацію ознак сполук MACCS (Molecular ACCess System
keys) у навчальному датасеті виконали за допомогою пакета RDKit (rdkit.org). Специфікації спрощеного наведення молекул у
рядку введення (SMILES) в автоматичному режимі шукали за допомогою сервісу PubChem (pubchem.ncbi.nlm.nih.gov).
Результати. У результаті дослідження обрали дві перспективні моделі машинного навчання бінарної класифікації, якість роботи
яких перевіряли на датасеті для перевірки. Статистичне оцінювання обраних моделей свідчить про високу ймовірність in silico
прогнозу щодо наявності або відсутності фармацевтичних несумісностей під час розроблення назальних рецептур церебропротективних лікарських форм і розміщення на вебсервері експертної системи ExpSys Nasalia (nasalia.zsmu.zp.ua) в розділі розрахунки.
Висновки. Опрацювали моделі машинного навчання для in silico прогнозу раціонального складу назальних лікарських форм церебропротективної дії. Підтвердження якості прогнозу фармацевтичних несумісностей із використанням опрацьованих моделей
виконали на датасеті для перевірки. Отримали статистичні показники моделей tree_blender (AUC 0.9521, F1 0.9747, MCC 0.9094),
boost_blender (AUC 0.9593, F1 0.9821, MCC 0.9352). Використання моделей машинного навчання у фармацевтичній розробці
сприятиме ресурсозбереженню та оптимізації складу рецептури. In order to save resource of active pharmaceutical ingredients and excipients, in the early stages of research, when planning an experiment,
it is advisable to use data of the predicted and experimental physicochemical properties stored in different aggregation databases.
The information found will reduce the time for composition development and for technology processing. However, the variety of active
compounds characteristics and excipients is not always reflected in these services. Recently, machine learning models have been widely
used in various scientific fields; they allow to obtain predictions with high reliability. Given the above, it is relevant and promising to
develop models of machine learning to predict the presence of pharmaceutical incompatibilities in the formulation of nasal dosage forms. The aim of the study is to develop models of machine learning for in silico forecast of the rational composition of nasal dosage forms
with cerebroprotective action.
Materials and methods. A dataset, containing data on compounds (active and auxiliary) and characteristics on the presence or absence
of interaction (pharmaceutical incompatibility), was used as material. Training datasets were filled by content analysis of PubMed library
data (pubmed.ncbi.nlm.nih.gov) manually, by keywords “pharmaceutical incompatibilities”, “physico-chemical compatibility”, “incompatible
excipients”) for the last 10 years. The resulting dataset comprises 1185 lines. The methods employed were a set of methods for binary
classification of machine learning (pycaret.org) using the programming language Python 3.8 (python.org) in the package management
environment Miniconda (conda.io). Pipeline programming was performed using Jupyter notebook package (jupyter.org). The generation
of MACCS (Molecular ACCess System keys) in the training dataset was performed using RDKit package (rdkit.org). Specifications
of the simplified representation of molecules in the input line (SMILES), in automatic mode, were searched using PubChem service
(pubchem.ncbi.nlm.nih.gov).
Results. The obtained data allowed to choose two perspective models of machine learning of binary classification, whose quality was
checked on a dataset for verification. Statistical evaluations of the selected models indicate a high probability of in silico prognosis for
the presence or absence of pharmaceutical incompatibilities in the development of nasal formulations of cerebroprotective dosage forms.
They are posted on the web server of the expert system ExpSys Nasalia (nasalia.zsmu.zp.ua) in the calculations section.
Conclusions. As a result of our research, we have developed machine learning models for in silico prediction of the rational
composition of nasal dosage forms with cerebroprotective action. Confirmation of the quality of the pharmaceutical incompatibilities
prediction, using the developed models, is checked on a dataset for check. The statistical indicators of the tree_blender (AUC 0.9521,
F1 0.9747, MCC 0.9094) and boost_blender (AUC 0.9593, F1 0.9821, MCC 0.9352) models were obtained. The use of machine
learning models in pharmaceutical development will contribute to resource conservation and optimization of the composition of the
formulation. Для ресурсосбережения активных фармацевтических ингредиентов и вспомогательных веществ на ранних этапах исследования
при планировании эксперимента целесообразно использовать данные по прогнозируемым и экспериментальным физико-химическим свойствам, которые находятся в разных агрегационных базах данных. Найденная информация позволит сократить время
на разработку состава и обработки технологии. Однако многообразие характеристик активных соединений и вспомогательных
веществ не всегда представлено в указанных сервисах. В последнее время модели машинного обучения широко применяют в
различных научных направлениях и позволяют прогнозировать результат с высокой достоверностью. Таким образом, актуальна
и перспективна разработка моделей машинного обучения для прогноза наличия фармацевтических несовместимостей в рецептуре назальных лекарственных форм.
Цель работы – разработка моделей машинного обучения для in silico прогноза рационального состава назальных лекарственных
форм церебропротективного действия.
Материалы и методы. В качестве материала использовали датасет, содержащий данные соединений (действующих и вспомогательных) и признаки о наличии или отсутствии взаимодействия (фармацевтической несовместимости). Наполнение датасета
для обучения (training datasets) осуществляли путем контент-анализа данных библиотеки PubMed (pubmed.ncbi.nlm.nih.gov) в
ручном режиме по ключевым словам («pharmaceutical incompatibilites», «physico-chemical compatibility», «incompatible excipients») за
последние 10 лет. Объём полученного датасета – 1185 строк. Использовали набор методов бинарной классификации машинного
обучения (pycaret.org) с применением языка программирования python 3.8 (python.org) в среде управления пакетами miniconda
(conda.io). Программирование пайплайна (pipeline) осуществляли с помощью пакета jupyter notebook (jupyter.org). Генерацию
признаков соединений MACCS (Molecular ACCess System keys) в датасете для обучения проводили с помощью пакета RDKit
(rdkit.org). Спецификации упрощенного представления молекул в строке ввода (SMILES) в автоматическом режиме искали с
помощью сервиса PubChem (pubchem.ncbi.nlm.nih.gov).
Результаты. В результате исследования выбрали две перспективные модели машинного обучения бинарной классификации,
качество работы которых проверяли на датасете для проверки. Статистические оценки избранных моделей свидетельствуют о
высокой вероятности in silico прогноза о наличии или отсутствии фармацевтических несовместимостей при разработке назальных рецептур церебропротективных лекарственных форм и размещены на веб-сервере экспертной системы ExpSys Nasalia
(nasalia.zsmu.zp.ua) в разделе расчёты.
Выводы. В результате исследований разработаны модели машинного обучения для in silico прогноза рационального состава назальных лекарственных форм церебропротективного действия. Подтверждение качества прогноза фармацевтических
несовместимости с использованием обработанных моделей проведено на датасете для проверки. Получены статистические
показатели моделей tree_blender (AUC 0,9521, F1 0,9747, MCC 0,9094), boost_blender (AUC 0,9593, F1 0,9821, MCC 0,9352).
Использование моделей машинного обучения в фармацевтической разработке будет способствовать ресурсосохранению и
оптимизации состава рецептуры. |
Описание: | Бурлака Б. С. - ORCID ID: 0000-0003-4539-7331;
Бєленічев І. Ф. - ORCID ID: 0000-0003-1273-5314. |
URI: | http://dspace.zsmu.edu.ua/handle/123456789/14414 |
Располагается в коллекциях: | Наукові праці. (Фармакологія та МР) Наукові праці. (Технологія ліків)
|
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.
|