«Черчилль» - програмний комплекс для швидкого аналізу геному

Доктор Пітер Вайт, директор Biomedical Genomics Core (Центру біомедичної геноміки), керівник команди, яка розробила обчислювальну систему «Черчилль».


Дослідники з Національної дитячої лікарні (Огайо, США) розробили новий метод аналізу даних, що скорочує час, необхідний для пошуку в геномі людини патологічних змін з декількох тижнів до декількох годин. Стаття, в якій описується надшвидке, добре масштабоване програмне забезпечення, опублікована в журналі Genome Biology.


"Знадобилося близько 13 років зусиль і 3 млрд доларів, щоб секвенувати перший людський геном, - говорить старший автор дослідження Пітер Вайт, директор Центру біомедичної геноміки, що входить в структуру Національної дитячої лікарні. - Тепер навіть найменші дослідницькі групи можуть отримати дані про геномну послідовність протягом декількох днів. Однак після цього настає момент, коли багато колективів впираються в стіну. Після визначення послідовності геному вченим необхідно проаналізувати величезний масив даних, щоб виділити дійсно корисну для досліджень і в клінічній практиці інформацію ".

Для подолання проблем, пов'язаних з аналізом великої кількості даних, д-р Уайт і його команда розробили обчислювальну систему «Черчилль» (Churchill). Вона здатна проводити ефективний аналіз цілого зразка геному всього за 90 хвилин.

"" Черчілль "повністю автоматизує процес аналізу, проганяючи весь масив сирих даних через комплексну послідовність алгоритмів спеціалізованого аналізу, які являють собою досить важкі з обчислювальної точки зору процеси. Зрештою, ми отримуємо список усіх генетичних відхилень і особливостей, готовий до третинної обробки і до клінічної інтерпретації, - пояснює Пітер Вайт, - Кожен з кроків процесу максимально оптимізований, а при його роботі не порушується цілісність даних. Вихідні дані можна відновити зі 100-відсотковою точністю ".

Ефективність роботи «Черчилля» підтверджена Національним інститутом стандартів і технологій (NIST). Порівняно з іншими обчислювальними комплексами «Черчилль» володіє найбільшою точністю (99,7%); точність обчислень становить 99,99%, а загальна ефективність діагностики 99,66%.

"У Національній дитячій лікарні перед нами стоїть стратегічна мета: введення геномної медицини в практику досліджень у галузі педіатрії та охорони здоров'я. Експрес-діагностика моногенних захворювань може мати вирішальне значення для лікування новонароджених, так що нашим першочерговим завданням було створення аналітичної системи, що працює максимально швидко, можливо, з втратою в точності, - розповідає Уайт. - Домігшись цього, ми виявили, що перевагою нової системи було те, що вона може бути адаптована і для масштабного геномного аналізу ".

Оптимізувавши використання ресурсів у процесі аналізу даних, команда доктора Вайта домоглася того, що «Черчілль» показує високу ефективність і масштабується для використання на декількох серверах. Інші подібні системи на це не розраховані. Ефективність і здатність задіяти потужні обчислювальні ресурси дозволяє проводити масштабні популяційні геномні дослідження. Так, використовуючи технологію розподілених обчислень, «Черчілль» за сім днів провів аналіз 1088 зразків повних геномів, отриманих в рамках проекту «1000 геномів», і визначив мільйони нових варіантів генетичних особливостей.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND