Как генеративният изкуствен интелект допринася за откриването на лекарства?

Генеративният изкуствен интелект допринася за откриването на лекарства, като генерира кандидат-молекули, предсказва техните свойства и изследва биологичните хипотези по-ефективно. Той позволява на екипите да разширят генерирането на идеи, предоставяйки повече възможности за експериментално тестване.

Може ли генеративният изкуствен интелект да намали броя на експериментите, необходими за откриването на лекарства?

Да, чрез генериране на широк набор от кандидат-молекули и хипотези преди тестване, генеративният изкуствен интелект позволява на екипите да провеждат по-малко „слепи“ експерименти, като в крайна сметка максимизират ефективността на процеса на откриване на лекарства.

Кои са основните предимства от използването на генеративен изкуствен интелект при откриването на лекарства?

Ключовите предимства на използването на генеративен изкуствен интелект в откриването на лекарства включват по-бързи итерационни цикли, подобрено генериране на хипотези, подобрени съвместни дискусии между различните дисциплини и възможност за приоритизиране на експерименти въз основа на информирани прогнози.

Какви предпазни мерки трябва да се вземат при използване на генеративен изкуствен интелект в откриването на лекарства?

Изключително важно е да се налагат строги ограничения, да се валидират резултатите като хипотези и да се поддържа цялостна проследимост на подканите и решенията, за да се предотврати потенциална злоупотреба или погрешно тълкуване на резултатите.

Как екипите гарантират, че резултатите от генеративния изкуствен интелект са надеждни?

Екипите трябва да третират резултатите от генеративния изкуствен интелект като хипотези, които трябва да бъдат тествани, да ги потвърдят с анализи и ортогонални модели и да прилагат филтри, за да елиминират безсмислените резултати, преди да продължат с каквито и да е експериментални планове.

Какви видове молекули може да помогне за откриването с помощта на генеративния изкуствен интелект?

Генеративният изкуствен интелект може да помогне при откриването както на малки молекули, така и на биологични продукти, като генерира кандидат-последователности, предлага модификации и предлага пътища за синтез въз основа на предварително дефинирани ограничения.

Необходим ли е човешки надзор при използване на генеративен изкуствен интелект за откриване на лекарства?

Да, човешкият надзор е от съществено значение за насочване на процеса, валидиране на генерираните резултати и гарантиране, че констатациите съответстват на биологичните и химичните знания, което прави процеса на вземане на решения по-стабилен.

Какви ограничения трябва да са наясно с екипите, когато използват генеративен изкуствен интелект?

Екипите трябва да са наясно, че генеративният изкуствен интелект понякога може да доведе до правдоподобни резултати, които са неправилни. Технологията може също така да има отклонения, базирани на данните за обучение, което води до потенциални рискове за качеството на резултатите.

Каква е ролята на генеративния изкуствен интелект в откриването на лекарства?

Кратък отговор: Генеративният изкуствен интелект ускорява главно ранното откриване на лекарства, като генерира кандидат-молекули или протеинови последователности, предлага пътища за синтез и извежда наяве проверими хипотези, така че екипите да могат да провеждат по-малко „слепи“ експерименти. Той се представя най-добре, когато налагате строги ограничения и валидирате резултатите; третиран като оракул, той може да заблуждава с увереност.

Ключови изводи:

Ускорение: Използвайте GenAI, за да разширите генерирането на идеи, след което го стеснете с стриктно филтриране.

Ограничения: Изисквайте диапазони от свойства, правила за скеле и ограничения за новост преди генериране.

Валидация: Третирайте резултатите като хипотези; потвърдете с анализи и ортогонални модели.

Проследимост: Записвайте подкани, резултати и обосновка, така че решенията да останат одитираеми и преглеждаеми.

Устойчивост на злоупотреби: Предотвратете изтичане на информация и прекомерна самоувереност чрез управление, контрол на достъпа и човешки преглед.

Каква е ролята на генеративния изкуствен интелект в откриването на лекарства? Инфографика

Статии, които може да ви харесат след тази:

🔗 Ролята на изкуствения интелект в здравеопазването
Как изкуственият интелект подобрява диагностиката, работните процеси, грижите за пациентите и резултатите.

🔗 Ще замести ли изкуственият интелект рентгенолозите?
Изследва как автоматизацията обогатява радиологията и какво остава човешко.

🔗 Ще замести ли изкуственият интелект лекарите?
Честен поглед върху влиянието на изкуствения интелект върху работата и практиката на лекарите.

🔗 Най-добрите инструменти на AI лаборатория за научни открития
Най-добрите инструменти за изкуствен интелект в лабораторията за ускоряване на експерименти, анализ и открития.

Ролята на генеративния изкуствен интелект в откриването на лекарства, на един дъх 😮💨

Генеративният изкуствен интелект помага на екипите за лекарства да създават кандидат-молекули, да предсказват свойства, да предлагат модификации, да предлагат пътища за синтез, да изследват биологични хипотези и да компресират итерационните цикли - особено в ранните етапи на откриване и оптимизиране на потенциални продукти. Nature 2023 (преглед на откриването на лиганди) Elsevier 2024 (генеративни модели в de novo дизайна на лекарства)

И да, може уверено да генерира глупости. Това е част от сделката. Като много ентусиазиран стажант с ракетен двигател. Ръководство за клиницисти (риск от халюцинации) npj Digital Medicine 2025 (халюцинации + рамка за безопасност)

Защо това е по-важно, отколкото хората признават 💥

Голяма част от работата по откритията е „търсене“. Търсене в химическото пространство, търсене в биологията, търсене в литературата, търсене на структурно-функционални връзки. Проблемът е, че химичното пространство е... почти безкрайно. Accounts of Chemical Research 2015 (химическо пространство) Irwin & Shoichet 2009 (мащаб на химическото пространство)

Може да прекарате няколко живота, опитвайки само „разумни“ вариации.

Генеративният изкуствен интелект измества работния процес от:

„Нека тестваме каквото можем да измислим“

до:

„Нека генерираме по-голям и по-интелигентен набор от опции, след което да тестваме най-добрите“

Не става въпрос за елиминиране на експерименти. Става въпрос за избор на по-добри експерименти. 🧠 Nature 2023 (преглед на откритията на лиганди)

Също така, и това е недостатъчно обсъждано, това помага на екипите да общуват между различни дисциплини. Химици, биолози, хора от DMPK, компютърни учени... всеки има различни ментални модели. Една добра генеративна система може да служи като споделен скицник. Преглед на Frontiers in Drug Discovery 2024

Какво прави една версия на генеративния изкуствен интелект добра за откриване на лекарства? ✅

Не всички генеративни ИИ са създадени еднакви. „Добрата“ версия за това пространство е по-малко за бляскави демонстрации и повече за несексуална надеждност (несексуалността е добродетел тук). Nature 2023 (преглед на откриването на лиганди)

Една добра система за генеративен изкуствен интелект обикновено има:

Заземяване на домейн: обучено или адаптирано към химични, биологични и фармакологични данни (не само общ текст) 🧬 Преглед на Elsevier 2024 (генеративни модели)
Ограничения - първо поколение: може да се подчинява на правила като липофилни диапазони, ограничения на скелета, характеристики на местата на свързване, цели за селективност JCIM 2024 (дифузионни модели в de novo дизайн на лекарства) REINVENT 4 (отворена рамка)
Осъзнаване на свойствата: генерира молекули, които са не само нови, но и „не са абсурдни“ от гледна точка на ADMET ADMETlab 2.0 (защо ранният ADMET е важен)
Докладване на неопределеност: сигнализира кога е предположение, а кога е надеждно (дори и груба доверителна лента помага) Принципи на валидиране на QSAR на ОИСР (област на приложимост)
Контроли „човек в цикъла“: химиците могат бързо да управляват, отхвърлят и насочват резултатите Nature 2023 (работен процес + контекст на технологиите за откриване)
Проследимост: можете да видите защо е възникнало дадено предложение (поне частично) или да действате на сляпо. Ръководство на OECD за QSAR (прозрачност на модела + валидиране)
Оценъчна система: докинг, QSAR, филтри, проверки за ретросинтез - всичко е свързано 🔧 Nature 2023 (преглед на откриването на лиганди) Машинно обучение в CASP (Coley 2018)
Контрол на отклоненията и изтичането: за да се избегне промъкването на запаметяването на данни от обучението (да, случва се) USENIX 2021 (извличане на данни от обучението) Vogt 2023 (опасявания, свързани с новост/уникалност)

Ако вашият генеративен изкуствен интелект не може да се справи с ограниченията, той е по същество генератор на новости. Забавно на партита. По-малко забавно в програма за борба с наркотиците.

Къде е мястото на генеративния изкуствен интелект в процеса на откриване на лекарства 🧭

Ето я простата ментална карта. Генеративният изкуствен интелект може да допринесе за почти всеки етап, но се представя най-добре там, където итерациите са скъпи и пространството за хипотези е огромно. Nature 2023 (преглед на откриването на лиганди)

Често срещани точки на контакт:

Откриване и валидиране на мишени (хипотези, картографиране на пътища, предложения за биомаркери) Преглед на Frontiers in Drug Discovery 2024
Идентификация на попадения (увеличаване на виртуалния скрининг, генериране на de novo попадения) Nature Biotechnology 2019 (GENTRL)
Оптимизация на потенциални клиенти (предлагане на аналози, многопараметрична настройка) REINVENT 4
Предклинична поддръжка (предсказване на свойствата на ADMET, понякога насоки за формулиране) ADMETlab 2.0
CMC и планиране на синтеза (предложения за ретросинтез, сортиране на маршрути) AiZynthFinder 2020 Coley 2017 (компютърно подпомаган ретросинтез)
Работа със знания (синтез на литература, обобщения на конкурентния пейзаж) 📚 Patterns 2025 (LLM в откриването на лекарства)

В много програми най-големите печалби идват от интеграцията на работния процес, а не от това, че един-единствен модел е „гениален“. Моделът е двигателят - тръбопроводът е колата. Nature 2023 (преглед на откриването на лиганди)

Сравнителна таблица: популярни генеративни подходи за изкуствен интелект, използвани в откриването на лекарства 📊

Леко несъвършена маса, защото реалният живот е леко несъвършен.

Инструмент / Подход	Най-добро за (публика)	Ценово	Защо работи (и кога не)
Генератори на молекули De novo (SMILES, графики)	Медицинска химия + съвместна химия	$$-$$$	Страхотен за бързо изследване на нови аналози 😎 - но може да изплюе нестабилни несъответствия REINVENT 4 GENTRL (Nature Biotech 2019)
Генератори на протеини / структури	Биологични екипи, структурна биология	$$$	Помага за предлагането на последователности + структури - но „изглежда правдоподобно“ не е същото като „работи“ AlphaFold (Nature 2021) RFdiffusion (Nature 2023)
Молекулен дизайн в дифузионен стил	Разширени екипи за машинно обучение	$$-$$$$	Силен в обусловяването на ограниченията и разнообразието - настройката може да бъде… цялостно нещо JCIM 2024 (дифузионни модели) PMC 2025 преглед на дифузията
Копилоти за прогнозиране на имоти (комбинация QSAR + GenAI)	DMPK, проектни екипи	$$	Добро за триаж и класиране - лошо, ако се третира като евангелие 😬 ОИСР (област на приложимост) ADMETlab 2.0
Планиращи ретросинтеза	Процесна химия, CMC	$$-$$$	Ускорява генерирането на идеи за маршрути - все още се нуждае от хора за осъществимост и безопасност AiZynthFinder 2020 Coley 2018 (CASP)
Мултимодални лабораторни копилоти (текст + данни от анализа)	Преводачески екипи	$$$	Полезно за извличане на сигнали от различни набори от данни - склонно към свръх самоувереност, ако данните са неравномерни Nature 2024 (партидни ефекти в клетъчното изобразяване) npj Digital Medicine 2025 (мултимодално в биотехнологиите)
Асистенти по литература и хипотези	Всеки, на практика	$	Съкращава значително времето за четене - но халюцинациите могат да бъдат хлъзгави, като изчезващи чорапи. Модели 2025 (LLMs in drug developing). Ръководство за клиницисти (халюцинации).
Модели за основи по поръчка, изработени по поръчка	Големи фармацевтични компании, добре финансирани биотехнологични компании	$$$$	Най-добър контрол + интеграция - също така скъп и бавен за изграждане (съжалявам, вярно е) Преглед на Frontiers in Drug Discovery 2024

Забележки: цените варират значително в зависимост от мащаба, изчислителните мощности, лицензирането и дали вашият екип иска „plug and play“ или „нека построим космически кораб“

По-отблизо: Генеративен изкуствен интелект за откриване на хитове и de novo дизайн 🧩

Това е основният случай на употреба: генериране на кандидат-молекули от нулата (или от скеле), които съответстват на целевия профил. Nature Biotechnology 2019 (GENTRL) REINVENT 4

Как обикновено работи на практика:

Дефиниране на ограничения
- клас на прицел, форма на свързващ джоб, известни лиганди
- диапазони на свойствата (разтворимост, logP, PSA и др.) Липински (контекст на правилото на 5)
- ограничения за новост (избягвайте известни IP зони) 🧠 Vogt 2023 (оценка на новост)
Генериране на кандидати
- скачане по скеле
- растеж на фрагменти
- Предложения за „декориране на това ядро“
- многоцелево генериране (свързване + пропускливост + почти нетоксично) REINVENT 4 Elsevier 2024 преглед (генеративни модели)
Филтрирайте агресивно
- правилата на медицинската химия
- PAINS и реактивни групови филтри Baell & Holloway 2010 (PAINS)
- проверки за синтезируемост AiZynthFinder 2020
- докинг / оценяване (несъвършено, но полезно) Nature 2023 (преглед на откриването на лиганди)
Изберете малък набор за синтез
- Хората все още избират, защото понякога могат да усещат глупости

Неловката истина: стойността не е само в „новите молекули“. Това са нови молекули, които имат смисъл за ограниченията на вашата програма. Последната част е всичко. Nature 2023 (преглед на откриването на лиганди)

Също така, леко преувеличение: когато се направи добре, може да се почувствате сякаш сте наели екип от неуморни младши химици, които никога не спят и никога не се оплакват. От друга страна, те също не разбират защо дадена стратегия за защита е кошмар, така че... баланс 😅.

По-отблизо: Оптимизация на лийдове с генеративен изкуствен интелект (многопараметърна настройка) 🎛️

Оптимизацията на лийдове е мястото, където мечтите се усложняват.

Искате:

повишаване на потентността
селективност нагоре
метаболитна стабилност
разтворимост нагоре
сигналите за безопасност са надолу
пропускливост „точно както трябва“
И все пак да бъде синтезируем

Това е класическа многоцелева оптимизация. Генеративният изкуствен интелект е необичайно добър в предлагането на набор от компромисни решения, вместо да се преструва, че има едно перфектно съединение. REINVENT 4 Elsevier 2024 преглед (генеративни модели)

Практически начини, по които екипите го използват:

Аналогово предложение: „Направете 30 варианта, които намаляват клирънса, но запазват ефикасността“
Заместващо сканиране: насочено проучване вместо грубо изброяване
Скачане на скеле: когато ядрото удари стена (токсичност, интелигентност или стабилност)
Предложения за обяснение: „Тази полярна група може да помогне за разтворимостта, но може да навреди на пропускливостта“ (не винаги е правилно, но е полезно)

Едно предупреждение: предсказващите свойства могат да бъдат крехки. Ако данните ви за обучение не съвпадат с вашата химическа серия, моделът може уверено да греши. Например, много грешен. И няма да се изчерви. Принципи за валидиране на QSAR на OECD (област на приложимост) Weaver 2008 (област на приложимост на QSAR)

По-отблизо: ADMET, токсичност и скрининг „моля, не убивайте програмата“ 🧯

ADMET е мястото, където много кандидати тихомълком се провалят. Генеративният изкуствен интелект не решава биологични проблеми, но може да намали грешките, които могат да бъдат избегнати. ADMETlab 2.0 Waring 2015 (отпадане)

Често срещани роли:

прогнозиране на метаболитни нарушения (места на метаболизъм, тенденции на клирънс)
маркиране на вероятни мотиви за токсичност (предупреждения, реактивни междинни продукти, заместители)
оценка на диапазоните на разтворимост и пропускливост
предлагане на модификации за намаляване на риска от hERG или подобряване на стабилността 🧪 FDA (ICH E14/S7B Въпроси и отговори) EMA (ICH E14/S7B общ преглед)

Най-ефективният модел обикновено изглежда така: използвайте GenAI, за да предложите опции, но използвайте специализирани модели и експерименти за проверка.

Генеративният изкуствен интелект е двигателят на идеите. Валидирането все още съществува в анализите.

По-отблизо: Генеративен изкуствен интелект за биологични продукти и протеиново инженерство 🧬✨

Откриването на лекарства не е само малки молекули. Генеративният изкуствен интелект се използва и за:

генериране на антитяло последователност
предложения за съзряване на афинитет
подобрения в стабилността на протеините
ензимно инженерство
изследване на пептидната терапия ProteinMPNN (Science 2022) Rives 2021 (модели на протеинов език)

Генерирането на протеини и секвенции може да бъде мощно, защото „езикът“ на секвенциите изненадващо добре съответства на методите на машинно обучение. Но ето и случайния обратен път: съответства добре... докато не престане да съответства. Защото имуногенността, експресията, моделите на гликозилиране и ограниченията за разработимост могат да бъдат брутални. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)

Така че най-добрите настройки включват:

филтри за разработимост
оценка на риска от имуногенност
ограничения на технологичността
цикли за мокри лаборатории за бърза итерация 🧫

Ако ги пропуснете, получавате великолепна последователност, която се държи като дива в продукцията.

По-отблизо: Планиране на синтеза и предложения за ретросинтеза 🧰

Генеративният изкуствен интелект се промъква и в химичните операции, не само в създаването на молекулярни идеи.

Планиращите ретросинтеза могат:

предложи пътища към целевото съединение
предложете търговски достъпни изходни материали
класиране на маршрутите по брой стъпки или предполагаема осъществимост
помогнете на химиците бързо да изключат „сладките, но невъзможни“ идеи AiZynthFinder 2020 Coley 2018 (CASP)

Това може да спести реално време, особено когато проучвате много кандидат-структури. Все пак, хората са от голямо значение тук, защото:

промени в наличността на реагенти
опасенията за безопасността и мащаба са реални
Някои стъпки изглеждат добре на хартия, но се провалят многократно

Не съвсем перфектна метафора, но все пак ще я използвам: ретросинтезният изкуствен интелект е като GPS, който е до голяма степен верен, само че понякога ви насочва през езеро и настоява, че това е пряк път. 🚗🌊 Coley 2017 (компютърно подпомаган ретросинтез)

Данни, мултимодални модели и сурова реалност на лабораториите 🧾🧪

Генеративният изкуствен интелект обича данните. Лабораториите произвеждат данни. На хартия това звучи просто.

Ха. Не.

Реалните лабораторни данни са:

непълен
шумен
пълен с партидни ефекти Leek et al. 2010 (партидни ефекти) Nature 2024 (партидни ефекти в клетъчното изобразяване)
разпръснати в различни формати
благословени с „креативни“ конвенции за именуване

Мултимодалните генеративни системи могат да комбинират:

резултати от анализа
химични структури
изображения (микроскопия, хистология)
омика (транскриптомика, протеомика)
текст (протоколи, ELN, доклади) npj Дигитална медицина 2025 (мултимодален в биотехнологиите) Медицински анализ на изображения 2025 (мултимодален ИИ в медицината)

Когато работи, е страхотно. Можете да откриете неочевидни модели и да предложите експерименти, които един специалист би пропуснал.

Когато се провали, се проваля тихо. Не затръшва вратата. Просто ви подтиква към уверено погрешно заключение. Ето защо управлението, валидирането и прегледът на областта не са по избор. Ръководство за клиницисти (халюцинации) npj Digital Medicine 2025 (халюцинации + рамка за безопасност)

Рискове, ограничения и разделът „не се заблуждавайте от плавния изход“ ⚠️

Ако помните само едно нещо, запомнете това: генеративният изкуствен интелект е убедителен. Може да звучи правилно, но да е грешен. Ръководство за клиницисти (халюцинации)

Ключови рискове:

Халюцинационни механизми: правдоподобна биология, която не е реална. Ръководство за клиницисти (халюцинации).
Изтичане на данни: генериране на нещо твърде близко до известни съединения USENIX 2021 (извличане на данни за обучение) Vogt 2023 (опасявания за новост/уникалност)
Прекомерна оптимизация: преследване на прогнозирани резултати, които не се превеждат in vitro Nature 2023 (преглед на откриването на лиганди)
Отклонение: данните от обучението са изкривени към определени хемотипове или мишени Vogt 2023 (оценка на модела + отклонение/новост)
Фалшива новост: „нови“ молекули, които всъщност са тривиални варианти Vogt 2023
Пропуски в обяснимостта: трудно е да се обосноват решенията пред заинтересованите страни Принципи на валидиране на QSAR на ОИСР
Проблеми със сигурността и IP адреса: чувствителни подробности за програмата в подканите 😬 USENIX 2021 (извличане на данни за обучение)

Смекчаващи мерки, които помагат на практика:

да държи хората в цикъла на вземане на решения
подкани и изходи в лога за проследяване
валидиране с ортогонални методи (анализи, алтернативни модели)
автоматично налага ограничения и филтри
третирайте резултатите като хипотези, а не като таблетки за истина. Ръководство на OECD QSAR

Генеративният изкуствен интелект е електроинструмент. Електрическите инструменти не те правят дърводелец... те просто правят грешки по-бързо, ако не знаеш какво правиш.

Как екипите внедряват генеративен изкуствен интелект без хаос 🧩🛠️

Екипите често искат да използват това, без да превръщат организацията в научен панаир. Практическият път за внедряване изглежда така:

Започнете с едно пречка (разширяване на попаденията, генериране на аналогови данни, сортиране на литературата) Nature 2023 (преглед на откриването на лиганди)
Изградете стегнат цикъл на оценка (филтри + докинг + проверки на свойствата + преглед на химикалите) REINVENT 4 AiZynthFinder 2020
Измерване на резултатите (спестено време, процент на попадения, намаляване на отпадането) Waring 2015 (отпадане)
Интегриране със съществуващи инструменти (ELN, регистър на съединения, бази данни за анализи) Ресурс на ELN в Единбург
Създаване на правила за употреба (какво може да бъде поискано, какво остава офлайн, стъпки за преглед) USENIX 2021 (риск от извличане на данни)
Обучавайте хората внимателно (сериозно, повечето грешки идват от неправилна употреба, а не от модела) Ръководство за клиницисти (халюцинации)

Също така, не подценявайте културата. Ако химиците чувстват, че им се налага изкуствен интелект, те ще го игнорират. Ако това им спестява време и уважава експертизата им, те ще го възприемат бързо. Хората са забавни в това отношение 🙂.

Каква е ролята на генеративния изкуствен интелект в откриването на лекарства, когато се отдалечите? 🔭

В по-малък мащаб, ролята не е „да се заменят учените“. Тя е „да се разшири научният обхват“. Nature 2023 (преглед на откриването на лиганди)

Това помага на екипите:

изследвайте повече хипотези всяка седмица
предлагайте повече кандидат-структури на цикъл
по-интелигентно приоритизиране на експериментите
компресиране на итерационни цикли между проектиране и тестване
споделяне на знания между отделните силози Patterns 2025 (LLMs в откриването на лекарства)

И може би най-недооценената част: помага ви да не хабите скъпата човешка креативност за повтарящи се задачи. Хората трябва да мислят за механизма, стратегията и интерпретацията, а не да прекарват дни в генериране на списъци с варианти на ръка. Nature 2023 (преглед на откриването на лиганди)

Така че да, ролята на генеративния изкуствен интелект в откриването на лекарства е ускорител, генератор, филтър и понякога проблем. Но ценна.

Заключително резюме 🧾✅

Генеративният изкуствен интелект се превръща в основна способност в съвременното откриване на лекарства, защото може да генерира молекули, хипотези, последователности и маршрути по-бързо от хората - и може да помогне на екипите да избират по-добри експерименти. Преглед на Frontiers in Drug Discovery 2024, Nature 2023 (преглед на откриването на лиганди).

Обобщени точки:

Най-добър е в ранното откриване и циклите за оптимизация на лийдове ⚙️ REINVENT 4
Поддържа малки молекули и биологични продукти GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
Повишава производителността чрез разширяване на фунията за идеи Nature 2023 (преглед на откриването на лиганди)
Необходими са ограничения, валидиране и хора, за да се избегнат самоуверени глупости. Принципи на OECD QSAR. Ръководство за клиницисти (халюцинации).
Най-големите печалби идват от интеграцията на работния процес, а не от маркетинговата пяна. Nature 2023 (преглед на откриването на лиганди)

Ако го третирате като сътрудник, а не като оракул, то наистина може да придвижи програмите напред. А ако го третирате като оракул... е, може да се окажете, че отново следвате този GPS в езерото.

Пример от реалния свят: Изграждане на работен процес за генериране на молекули, базиран на ограничения 🧪

Сценарий

Малък, измислен, но реалистичен биотехнологичен екип работи върху цел за възпалително заболяване. Те вече имат 42 потвърдени слаби попадения от скрининга, но повечето имат лоша разтворимост, а няколко са твърде близо до патентното пространство на конкурентите.

Вместо да поиска от генеративен модел да „намери по-добри молекули“ - което е по същество покана за получаване на елегантни глупости - екипът изгражда стегнат работен процес за разширяване на броя на попаденията.

Целта е проста: да се генерира по-широк набор от аналози, да се филтрират стриктно и да се изпращат само най-защитимите кандидати за преглед по медицинска химия.

От какво се нуждае асистентът

Екипът предоставя на системата:

профил на целта и информация за известния лиганд

42-те потвърдени ударни структури

граници на свойствата за молекулно тегло, logP, TPSA, разтворимост и прогнозиран клирънс

блокирани скелета и прагове на сходство за избягване на IP

PAINS и реактивни групови филтри Baell & Holloway 2010

Прогнозата на ADMET проверява ADMETlab 2.0

проверки за осъществимост на ретросинтеза AiZynthFinder 2020

правила за човешка проверка за окончателен избор

Важната част: моделът не може сам да оптимизира потентността си. Той трябва да балансира потентността, новостта, възможността за разработване и синтезабилността.

Примерна инструкция

Генерирайте 150 аналогови идеи въз основа на тези потвърдени структури с положителен резултат. Поддържайте молекулно тегло между 300 и 480, прогнозиран logP между 1,5 и 4,0, TPSA под 110 и избягвайте блокираните скелета, изброени в IP файла. Приоритизирайте структури без PAINS предупреждения, без очевидни реактивни групи и правдоподобен път на синтез от пет или по-малко стъпки. За всяка молекула обяснете основната модификация, желаното подобрение на свойствата, ключовия риск и дали съединението трябва да бъде отхвърлено, преразгледано или приоритизирано.

Как да го тествам

Екипът не се доверява на първия изход. Те изпълняват малък цикъл на оценка:

Проверете дали генерираните молекули спазват ограниченията на свойствата

Премахнете почти дубликати и структури, твърде близки до известни съединения

Изпълнете PAINS, реактивни групи и основни филтри за медицинска химия

Изпълнете втори модел на свойство, за да сравните ADMET прогнозите

Помолете двама химици независимо един от друг да оценят 30-те най-добри кандидати

Изпратете само най-високо оценения кратък списък в дискусията за синтез

Ценен тестов въпрос е: „Ще обмислим ли тази молекула, ако изкуственият интелект не я беше предложил?“

Когато отговорът е „не“, екипът пита защо. Понякога това разкрива добра нова идея. Понякога разкрива самозаблуждаващо се мислене, основано на модел.

Резултат

Само илюстративен резултат - не е реален казус на компания.

Въз основа на времетраенето на три примерни задачи за разширяване на резултатите, ръчният работен процес отне около 5 часа за създаване и сортиране на 60 аналогови идеи. Работният процес на GenAI, базиран на ограничения, създаде 150 първоначални кандидата за около 55 минути.

След филтриране, само 27 кандидата са оцелели след пълното разглеждане. От тях химиците са оценили 9 като заслужаващи по-задълбочен преглед, 12 като „интересни, но рискови“ и 6 като отхвърлени при преглед.

Това означава, че ценният резултат не беше „150 нови молекули“. Ценният резултат беше 9 кандидата, годни за преглед, за по-малко от 1 час, с ясна одитна следа, показваща кои ограничения е преминал или не е преминал всеки кандидат.

Екип би могъл да провери това, като проследи:

време, прекарано за всеки цикъл на проектиране

брой генерирани структури

процент, премахнат от филтрите

процент на приемане от химик

брой кандидати, избрани за синтез

номер, по-късно потвърден като активен в анализа

Какво може да се обърка

Моделът може да се оптимизира около филтрите, вместо да предлага наистина стабилна химия.

Кандидат може да изглежда отлично в прогнозирания ADMET, но веднага да не успее в реален анализ. Принципи на валидиране на QSAR на OECD

Предложенията за ретросинтез може да изглеждат правдоподобни, когато се основават на недостъпни реактиви, неудобни условия или опасна химия.

Филтърът за новости може да премахва ценни съединения твърде агресивно или да пропуска молекули, които все още са твърде близо до известното IP.

Най-голямата грешка е да се третира класираният списък като истина. Той е само списък с приоритизирани хипотези.

Практично извлечение

Най-доброто приложение на генеративния изкуствен интелект в откриването на лекарства не е „натисни бутон, вземи лекарство“. Това е контролирана фабрика за идеи: генерирай широко, филтрирай брутално, документирай всяко решение и остави учените да вземат окончателното решение.

ЧЗВ

Каква е ролята на генеративния изкуствен интелект в откриването на лекарства?

Генеративният изкуствен интелект разширява канала за идеи в ранното откриване и оптимизирането на потенциални клиенти, като предлага кандидат-молекули, протеинови последователности, пътища на синтез и биологични хипотези. Стойността е по-малко в „заместването на експерименти“ и повече в „изборът на по-добри експерименти“ чрез генериране на много опции и след това старателно филтриране. Той работи най-добре като ускорител в рамките на дисциплиниран работен процес, а не като самостоятелен инструмент за вземане на решения.

Къде генеративният изкуствен интелект се представя най-добре в процеса на откриване на лекарства?

Той обикновено предоставя най-голяма стойност, когато пространството за хипотези е огромно и итерациите са скъпи, като например идентифициране на попадения, de novo дизайн и оптимизация на потенциални клиенти. Екипите го използват и за ADMET триаж, предложения за ретросинтез и подкрепа на литература или хипотези. Най-големите ползи обикновено идват от интегрирането на генерирането с филтри, оценяване и човешки преглед, вместо да се очаква един-единствен модел да бъде „интелигентен“

Как се задават ограничения, така че генеративните модели да не произвеждат безполезни молекули?

Практически подход е да се дефинират ограничения преди генериране: диапазони на свойствата (като разтворимост или logP цели), правила за скелето или подструктурата, характеристики на местата на свързване и граници на новост. След това се прилагат филтри за медицинска химия (включително PAINS/реактивни групи) и проверки за синтезируемост. Генерирането с ограничения първо е особено полезно при молекулярен дизайн в дифузионен стил и рамки като REINVENT 4, където могат да се кодират многоцелеви цели.

Как екипите трябва да валидират резултатите от GenAI, за да избегнат халюцинации и свръх самоувереност?

Третирайте всеки резултат като хипотеза, а не като заключение, и го валидирайте с анализи и ортогонални модели. Генерирайте двойки с агресивно филтриране, докинг или оценяване, където е уместно, и проверки на областта на приложимост за предсказващи фактори в стил QSAR. Направете несигурността видима, когато е възможно, защото моделите могат да бъдат уверено грешни по отношение на химията извън дистрибуцията или несигурните биологични твърдения. Прегледът от човек в цикъла остава основна функция за безопасност.

Как можете да предотвратите изтичане на данни, риск за IP и „запаметени“ изходи?

Използвайте контроли за управление и достъп, така че чувствителни детайли на програмата да не се поставят небрежно в подканите, и регистрирайте подканите/изходите за одит. Приложете проверки за новост и сходство, така че генерираните кандидати да не се намират твърде близо до известни съединения или защитени региони. Спазвайте ясни правила за това какви данни са разрешени във външни системи и предпочитайте контролирани среди за работа с висока чувствителност. Човешкият преглед помага за ранно откриване на „твърде познати“ предложения.

Как се използва генеративният изкуствен интелект за оптимизация на лийдове и многопараметрична настройка?

При оптимизацията на потенциални клиенти, генеративният изкуствен интелект е ценен, защото може да предложи множество компромисни решения, вместо да се преследва едно-единствено „перфектно“ съединение. Често срещаните работни процеси включват аналогови предложения, насочено сканиране на заместители и прескачане на скелета, когато ограниченията за потентност, токсичност или интелигентен пропуск блокират напредъка. Предсказващите свойства могат да бъдат крехки, така че екипите обикновено класират кандидатите с множество модели и след това експериментално потвърждават най-добрите опции.

Може ли генеративният изкуствен интелект да помогне и с биологичните продукти и протеиновото инженерство?

Да - екипите го използват за генериране на антитяло-последователност, идеи за афинитетно зреене, подобрения в стабилността и изследване на ензими или пептиди. Генерирането на протеини/последователности може да изглежда правдоподобно, без да е разработваемо, така че е важно да се прилагат филтри за разработване, имуногенност и технологичност. Структурни инструменти като AlphaFold могат да подкрепят разсъжденията, но „правдоподобната структура“ все още не е доказателство за експресия, функция или безопасност. Циклите в мокра лаборатория остават от съществено значение.

Как генеративният изкуствен интелект поддържа планирането на синтеза и ретросинтеза?

Планиращите ретросинтеза могат да предложат маршрути, изходни материали и класиране на маршрути, за да ускорят генерирането на идеи и бързо да изключат неосъществими пътища. Инструменти и подходи като планиране в стил AiZynthFinder са най-ефективни, когато са съчетани с реални проверки за осъществимост от химици. Наличността, безопасността, ограниченията за мащабиране и „хартиените реакции“, които се провалят на практика, все още изискват човешка преценка. Използвано по този начин, се спестява време, без да се преструва, че химията е решена.

Референции

Nature - Преглед на откритията на лиганди (2023) - nature.com
Природна биотехнология - GENTRL (2019) - nature.com
Природа - AlphaFold (2021) - nature.com
Природа - RF дифузия (2023) - nature.com
Nature Biotechnology - Протеинов генератор (2024) - nature.com
Nature Communications - Партидни ефекти в клетъчното изобразяване (2024) - nature.com
npj Дигитална медицина - Халюцинации + рамка за безопасност (2025) - nature.com
npj Дигитална медицина - Мултимодална медицина в биотехнологиите (2025) - nature.com
Наука - ProteinMPNN (2022) - science.org
Клетъчни модели - LLM в откриването на лекарства (2025) - cell.com
ScienceDirect (Elsevier) - Генеративни модели в de novo дизайна на лекарства (2024) - sciencedirect.com
ScienceDirect (Elsevier) - Vogt (2023): опасения за новост/уникалност - sciencedirect.com
Анализ на медицински изображения (ScienceDirect) - Мултимодален изкуствен интелект в медицината (2025) - sciencedirect.com
PubMed Central - Ръководство за клиницисти (риск от халюцинации) - nih.gov
Отчети за химични изследвания (публикации на ACS) - Chemical space (2015) - acs.org
PubMed Central - Irwin & Shoichet (2009): химическа пространствена скала - nih.gov
Граници в откриването на лекарства (PubMed Central) - Преглед (2024) - nih.gov
Journal of Chemical Information and Modeling (ACS Publications) - Дифузионни модели в de novo дизайна на лекарства (2024) - acs.org
PubMed Central - REINVENT 4 (отворена рамка) - nih.gov
PubMed Central - ADMETlab 2.0 (ранни въпроси за ADMET) - nih.gov
ОИСР - Принципи за валидиране за регулаторни цели на (Q)SAR модели - oecd.org
ОИСР - Ръководен документ за валидиране на (Q)SAR модели - oecd.org
Справочник на химичните изследвания (ACS Publications) - Компютърно подпомагано планиране на синтеза / CASP (Coley, 2018) - acs.org
Централна наука на ACS (публикации на ACS) - Компютърно подпомаган ретросинтез (Coley, 2017) - acs.org
PubMed Central - AiZynthFinder (2020) - nih.gov
PubMed - Липински: Контекст на правилото на 5 - nih.gov
Списание за медицинска химия (публикации на ACS) - Baell & Holloway (2010): PAINS - acs.org
PubMed - Уоринг (2015): отпадане - nih.gov
PubMed - Rives (2021): модели на протеинови езици - nih.gov
PubMed Central - Leek et al. (2010): партидни ефекти - nih.gov
PubMed Central - Преглед на Diffusion (2025) - nih.gov
FDA - E14 и S7B: клинична и неклинична оценка на удължаването на QT/QTc интервала и проаритмичния потенциал (Q&A) - fda.gov
Европейска агенция по лекарствата - Общ преглед на насоките на ICH E14/S7B - europa.eu
USENIX - Carlini et al. (2021): извличане на данни за обучение от езикови модели - usenix.org
Университет в Единбург – Услуги за цифрови изследвания - Ресурс за електронни лабораторни тетрадки (ELN) - ed.ac.uk
ScienceDirect (Elsevier) - Weaver (2008): Област на приложимост на QSAR - sciencedirect.com

Намерете най-новия изкуствен интелект в официалния магазин за асистенти с изкуствен интелект

За нас

Обратно към блога

Допълнителни ЧЗВ

Как генеративният изкуствен интелект допринася за откриването на лекарства?

Генеративният изкуствен интелект допринася за откриването на лекарства, като генерира кандидат-молекули, предсказва техните свойства и изследва биологичните хипотези по-ефективно. Той позволява на екипите да разширят генерирането на идеи, предоставяйки повече възможности за експериментално тестване.
Може ли генеративният изкуствен интелект да намали броя на експериментите, необходими за откриването на лекарства?

Да, чрез генериране на широк набор от кандидат-молекули и хипотези преди тестване, генеративният изкуствен интелект позволява на екипите да провеждат по-малко „слепи“ експерименти, като в крайна сметка максимизират ефективността на процеса на откриване на лекарства.
Кои са основните предимства от използването на генеративен изкуствен интелект при откриването на лекарства?

Ключовите предимства на използването на генеративен изкуствен интелект в откриването на лекарства включват по-бързи итерационни цикли, подобрено генериране на хипотези, подобрени съвместни дискусии между различните дисциплини и възможност за приоритизиране на експерименти въз основа на информирани прогнози.
Какви предпазни мерки трябва да се вземат при използване на генеративен изкуствен интелект в откриването на лекарства?

Изключително важно е да се налагат строги ограничения, да се валидират резултатите като хипотези и да се поддържа цялостна проследимост на подканите и решенията, за да се предотврати потенциална злоупотреба или погрешно тълкуване на резултатите.
Как екипите гарантират, че резултатите от генеративния изкуствен интелект са надеждни?

Екипите трябва да третират резултатите от генеративния изкуствен интелект като хипотези, които трябва да бъдат тествани, да ги потвърдят с анализи и ортогонални модели и да прилагат филтри, за да елиминират безсмислените резултати, преди да продължат с каквито и да е експериментални планове.
Какви видове молекули може да помогне за откриването с помощта на генеративния изкуствен интелект?

Генеративният изкуствен интелект може да помогне при откриването както на малки молекули, така и на биологични продукти, като генерира кандидат-последователности, предлага модификации и предлага пътища за синтез въз основа на предварително дефинирани ограничения.
Необходим ли е човешки надзор при използване на генеративен изкуствен интелект за откриване на лекарства?

Да, човешкият надзор е от съществено значение за насочване на процеса, валидиране на генерираните резултати и гарантиране, че констатациите съответстват на биологичните и химичните знания, което прави процеса на вземане на решения по-стабилен.
Какви ограничения трябва да са наясно с екипите, когато използват генеративен изкуствен интелект?

Екипите трябва да са наясно, че генеративният изкуствен интелект понякога може да доведе до правдоподобни резултати, които са неправилни. Технологията може също така да има отклонения, базирани на данните за обучение, което води до потенциални рискове за качеството на резултатите.