Ви є тут

CyberPlantUA - проект по дослідженню рослин комп'ютерними методами та кооперація

 CyberPlantUA - http://cyberplant.ifbg.org.ua/uk/

 

За останні роки накопичилось величезна кількість геномної і генетичної інформації, яка у більшості випадків депонована в архівних базах даних, і її організація у більшості випадків хаотична, зокрема це стосується даних щодо рослин. Це слугувало основою для створення спеціалізованих і похідних баз даних і ресурсів, що відповідали б окремим напрямкам дослідження. Водночас, відсутність на українському ринку web-порталу спрямованого на підтримку фундаментальних та прикладних досліджень в галузі біології рослин, але враховуючи місто агросектору в економіці країни, необхідність в такому ресурсі наразі очевидна. Саме існування такого ресурсу дає можливість розвивати кооперацію з науковими установами в Україні та закордонними науково-навчальними організаціями, зокрема European Plant Science Organisation (epsoweb.org), Global Plant Council globalplantcouncil.org), International Society for Horticultural Science (ishs.org), EUCARPIA (eucarpia.org), COGECA (copa-cogeca.eu), а також різними науковими товариствами з біології рослин: FEBS (Європа), SPPS (Скандинавія), ASPB (США), JSPP (Японія), SEB (Велика Британія) тощо. Окрім того, розробка web-порталу CyberPlantUA надає ряд переваг:

  • більш детальна спеціалізація сервісу для проведення досліджень у галузі клітинної біології, молекулярної генетики та філогенії рослин,
  • верифіковані алгоритми для пошуку та аналізу цільових мішеней,
  • аналіз інформації про структуру геномів рослин,
  • своєчасна та кваліфікована підтримка аналітичної групи.

 Завдяки розвитку плідної співпраці з іншими організаціями НАН України колектив проекту реалізує ідею, яка сприятиме об’єднанню науковців і комерційних організацій для вирішення задач біології рослин.

Першочергово у 2020му році було створено і розроблено архітектуру web-порталу CyberPlantUA та додано ресурси серверного вузла Державної установи «Інститут харчової біотехнології та геноміки Національної академії наук України». Увагу було приділено структурі web-порталу CyberPlantUA; маркетинговим дослідженням розміщення та аналітики web-порталу; розробці оптимального менеджеру повного циклу; адаптації технічного завдання під потреби кінцевого користувача; інтеграції баз даних відомих сервісів для аналізу мішеней рослин та їх анотування, зокрема CSModDB і GMPlantsGW; стандартизації ключових слів характерних для карти сайту в полі рослинної біології та її адаптації для української наукової спільноти, інтеграції лічильників веб-аналітики, посилань на соціальної мережі для співтовариства біологів рослин, викладачів вузів та ін. для обміну інформацією, спільних досліджень тощо, а також наповненню даними web-порталу CyberPlantUA. 

Слід зазначити, що аспекти таргетних бібліотек у відкритому доступі web-порталу CyberPlantUA є дуже актуальними в економічному плані у зв’язку з існуванням патогенних ліній і штамів збудників захворювань сільськогосподарських рослин, які специфічні саме для України. Більше того, що за доступністю сервісів web-портал CyberPlantUA буде сайтом напіввідкритого типу, тобто для повного доступу до інструментів і репозиторіїв буде необхідно пройти безкоштовну реєстрацію.

За схемою подання інформації, її обсягом і типом задач web-порталу CyberPlantUA розроблена платформа відноситься до змішаного типу веб-ресурсів. Відповідно до розробленої концепції, web-ресурс CyberPlantUA містить декілька елементів: інтернет-портал, інформаційний ресурс і набір веб-сервісів, об’єднаних у тематичні сторінки.

За технологією відображення інформації ресурс CyberPlantUA також має змішану природу. Статичні сторінки html було доповнено базами даних динамічних сторінок-шаблонів (CSS - Cascading Style Sheets). Вони формуються за запитом в режимі взаємодії статичних таблиць і баз даних, що будуть містити інформацію (у розробці та наповненні), скрипти і графічний контент у виді дискретних файлів.

У аспекті соціального та економічного значення проекту слід зауважити відсутність на сьогодні в Україні професійної соціальної мережі, що виконує функцію дискусійної платформи спілкування наукової спільноти біологів рослин, викладачів вузів, фахівців суміжних галузей (хіміки, програмісти, математики, тощо), бізнесу, та ін. Розроблений web-портал CyberPlantUA ліквідує брак обміну інформацією, обговорення семантичної складової нових термінів та відсутність описових матеріалів науковою українською мовою. В останній час це особливо актуально у зв’язку із інвазією нових термінів, які у більшості випадків є калькою з англійської мови (приклад - біоінформаційні методи / біоінформатичні методи та ін.), а також відкритих репозитаріїв для результатів наукових досліджень.

Система складається з наступних частин – інформаційного порталу, шлюзу і сховища. Шлюз агрегує і впорядковує дані із зовнішніх баз даних. Ці дані після валідації згодом переходять до сховища, де вони можуть бути доповнені новими отриманими даними та інформацією від українських дослідників. До розділів web-порталу CyberPlantUA було включено розроблені бібліотеки та бази даних єдиної системи аналізу та напрацювання у галузі:

  • даних генетично-модифікованих рослин;
  • молекулярної філогенетики цільових мішеней цитоскелету (*.fasta бібліотеки тубулінів, FtsZ-білків, БАМів, кінезинів, протеїнкіназ та протеїнфосфатаз, ацетилтрансфераз послідовностей тощо);
  • розробки біологічно-активних речовин (побудова системи віртуального скринінгу в аспекті задач рослинної біології, яка раніше була реалізована колективом на прикладі віртуальної грід-організації CSLabGrid, наведена на Рис. 1);
  • даних просторових структур білків цитоскелету.

Немає жодного сумніву, що одним із найбільш фундаментальних і складних питань біології є коректна систематика видів. Розвиток молекулярної біології і біоінформатики відкрив новий етап у цій найбільш традиційній галузі біології. Послідовності генів і білків стали невід’ємними факторами, що враховуються під час філогенетичних досліджень. Один з розділів ресурсу CyberPlantUA присвячено питанням молекулярної філогенетики і екстраполяції її результатів на традиційні постулати систематики рослин. Планується можливість створення як галерей зображень філогенетичних дерев, побудованих із використанням різних біополімерів, так і репозиторіїв вихідних файлів в форматі *.fasta для їх вільного завантаження користувачами ресурсу. Наразі подібні сервіси та депозиторії  в Україні відсутні.

Іншим запланованим сервісом є блок, присвячений вирішенню комплексу обчислювальних задач, пов'язаних з дослідженням молекулярної організації цитоскелету (в тому числі рослинного), дослідження механізмів клітинного поділу, а також розкриття потенціалу основних білків цитоскелету і асоційованих з ним білків (БАМ, протеїнкінази, протеїнфосфатази та ін.) як перспективних молекулярних мішеней для біологічно активних сполук. Стратегічно, обчислювальні задачі, що вирішуються ВО CSLabGrid, охоплюють високопропускний молекулярний скринінг, молекулярний докінг, обрахунки задач з молекулярної динаміки, 3D-QSAR, задачі класичної біоінформатики, а також зберігання та обробку даних лазерної конфокальної та електронної мікроскопії. На даний час, це частково реалізовано в базі даних структурних моделей білків цитоскелету - CSModDB (http://csmoddb.ifbg.org.ua/comodore/), проте у подальшому наповнення CSModDB буде здійснюватись з різних джерел, але штатним інструментом для реконструкції просторової структури білків має стати розроблений раніше грід-сервіс ITS (https://grid.ifbg.org.ua/its/submit.php). Даний мережевий сервіс є спеціалізованою адаптацією популярного інструменту I-TASSER (Iterative Threading ASSEmbly Refinement), але його актуальна реалізація підтримує виконання обрахунків у Грід (UNG), а також відсутність обмежень по кількості задач, що подаються окремим користувачем (за наявності відповідного сертифікату користувача).

Іншою складовою ресурсу CyberPlantUA  є Український портал даних по генетичним модифікаціям рослин “Genetically Modified Plants Gateway” (GMPlantsGW). Метою якого є інтеграція ключової інформації по генетичним модифікаціям рослин та методам їх детекції з відкритих джерел – Інтернет баз даних, статей і документів, та можливість доповнення зазначеної інформації даними, специфічними для України – інформацією про використання окремих сортів, результатами тестів та випробувань, правовими актами та документами, рекомендаціями по застосуванню та визначенню. З бази даних GMplantsGW було додано інформацію з детальним описом кожного окремого епізоду генетичної модифікації, що сприяє аналізу та розробці методів виявлення. А також, по кожній події генетичної модифікації – детальна інформація по методам виявлення. Загальна інформація про події ГМО включає її назву, OECDUI (унікальний ідентифікатор Організації економічного співробітництва та розвитку ОЕСР/OECD), торгове найменування, вихідний вид, нововведені риси, екзогенні вставки, методи трансформації, вектори трансформації і розробник або компанія, що тримає ліцензію. Джерелом даних про послідовності-вставки ГМО є опубліковані наукові статті, публічно доступна база даних нуклеотидних послідовностей GenBank, патенти і офіційні петиції розробників до урядових організацій. На додаток до інформації про послідовності, для доступу до іншої інформації про модифікації, такі як результати тестування та висновки з огляду біобезпеки наведено посилання на відповідні документи – американські офіційні петиції, японські офіційні петиції, Agbios, GMO-Compass, Biodiv LMO Database, звіти GMO watch і т.д. Інформація про методи виявлення ГМ організмів згрупована за методами, що базуються на аналізі білкових продуктів і нуклеотидних послідовностей. Інформація про методи, що ґрунтуються на аналізі нуклеїнових кислот, включають: праймери, зонди, інформацію про довжину амплікона, маркери позиції пар праймерів, ендогенні референсні гени, сертифіковані еталонні зразки, стандартні референсні молекули, інформацію про статус валідації, а також – довідкові статті. У даний час більшість методів на основі аналізу білків засновані на готових комерціалізованих наборах, тому необхідно відстежувати, як відкриті, так і комерційні набори та інші засоби для аналізу – причина, чому GMDD охоплює як комерційні набори, так і методи, які не вимагають їх використання. З технічної точки зору проект реалізується у вигляді веб-додатку на основі Grails – високопродуктивного програмного каркасу для веб-розробки на платформі Java. Мовою програмування є Groovy, заснований на Java. Рівень object relational mapping (ORM) побудовано на основі Hibernate. Поведінковий рівень – на основі Spring MVC. Окрім того, пакети NCBI BLAST2 і BioPerl також застосовані для можливості запровадження функцій BLAST (Basic Local Alignment Search Tool - https://blast.ncbi.nlm.nih.gov/Blast.cgi) для всіх екзогенно-інтродукованих послідовностей.

Отже, протягом виконання проекту було розроблено сайт інформаційно-аналітичного порталу web-порталу CyberPlantUA та інтегрувано в нього базу даних просторових структур білків цитоскелету CSModDB і першу Українську базу даних генетично-модифікованих рослин GMPlantsGW, спрямованих на підтримку фундаментальних та прикладних досліджень і розробок в галузі біології рослин.

Категорія: