Являются ли решения для больших данных, такие как Hadoop и другие, полезными для решения проблем биоинформатики? Каковы из подходов Big Data могут быть использованы для биоинформатического анализа?

спросил от (5.4k баллов)

1 Ответ

В то время как собственно большие данные в биологии, как правило, меньше, чем, скажем, онлайновые наборы метаданных, данные в физике элементарных частиц или наборы астрофизических данных, мы также склонны иметь гораздо более короткие временные рамки для анализа ( если сравнивать с физикой то есть) и разные требования и проблемы. Hadoop и некоторые другие распространенные подходы «больших данных», как правило, недоиспользуются в биоинформатике, причем, IMHO, существуют лишь несколько примеров инструментов, которые их используют.
Для некоторых из нас облачные вычисления не являются подходящими. Я не могу хранить данные, полученные от пациентов, на серверах, физически расположенных за пределами своей страны. Поэтому я придерживаюсь рабочих станций и кластеров в моем университете или в партнерских учреждениях. Все это говорит о том, что многие из лучших инструментов биоинформатики, которые разрабатываются, по крайней мере находятся в разработке должны максимально использовать не только параллельные вычисления и вычислительную оптимизацию но и эффективные стратегии хранения, индексации и поиска и т. д

ответил от (3.1k баллов)