SEO

30 Ноя, 2016

Как работает (и лечит) первый поисковик по ДНК (+видео)

Когда-то в статье про seo в эпоху интернет-вещей написал, что сегодня нет ничего сложного в том, чтобы оптимизировать свой сайт под поисковые системы. И если кто-то говорит вам, что это сложно и дорого, не верьте — подумайте о том, что будет означать оптимизация под поисковые системы, когда кому-то когда-то зачем-то понадобится поиск по разного рода устройствам, их функциям или вообще по телу человека, например…

И вот прошло всего ДВА ГОДА — и свершилось. Я и подумать не мог, что это будет так скоро!

Первый поисковик по ДНК

Первый поисковик по ДНК

Смотрите ролик с микробиологом Константином Севериновым и наслаждайтесь — первый поисковик по ДНК уже разработан :) И что самое удивительное — разработчиками выступили бактерии, а мы просто в очередной раз позаимствовали чужую идею…

13-я минута:

«Задача генной медицины — не лечить, задача просто — НАЙТИ правильное место и там разрезать. Нам нужен молекулярный скальпель. Нам нужно среди 3 миллиардов букв попасть в то место, на страницу номер такую-то, вот в этой самой строчке, где есть ОДНА опечатка».

Эта цитата поразила меня до глубины души еще и потому, что буквально пару недель назад я написал у себя в Фейсбуке следующее:

Чтобы стать хорошим канатоходцем, надо научиться не только держать равновесие, но и вязать узлы. Чтобы стать менеджером, достаточно научиться узлы рубить.

18-я минута:

«На практике всегда есть проблемы, и проблемы связаны с тем, что наша книга ДНК действительно очень большая, поэтому некоторые слова в ней могут повторяться. Или могут встречаться очень похожие слова. У Борхеса есть какая-то безумная библиотека, такой образ, там все слова, которые могут быть — есть. Но есть и варианты, очень похожие на искомое слово. И абсолютной точности этот метод, по-видимому, не может дать.

В частности, опыт китайских ученых показал, что они действительно во многих эмбрионах излечили то самое место, которое их интересовало. К сожалению, они еще дополнительно ввели мутации и в ряд других мест, в которых у них не было цели сделать никаких мутаций. Эти мутации могут ничего не значить — в конечном счете, мы же с вами отличаемся по 30 миллионам позиций, и ничего. А может, они к чему-то и приведут…»

Это то, о чем я рассказываю на курсе seo и интернет-маркетинга. Думаю, любой, кто занимался подбором семантического ядра, поймет суть описанной проблемы. Ну и для филологов, лингвистов и т.п. специалистов это знакомо… Для меня поразительно то, как сильно вопросы текстовой релевантности соотносятся с законами и инструментами микробиологии и генетики!..

По этому поводу приведу вам еще одну цитату из статьи на сайте Biomolecula.ru — прочувствуйте параллели:

эпигенетика и текст

Эпигенетика и текст

А вот следующий шаг в развитии описываемого поисковика по ДНК легко прогнозируется — это создание инструмента для поиска по каждой из 10 триллионов клеток, из которых мы состоим. Затем исправление искажений на лету. И… всякое такое, что звучит фантастически и пугающе одновременно — тут я лучше помолчу, наверно)))

Кстати, сайтов в интернете, по которым сейчас ведется поиск, пока намного меньше, чем клеток в вашем теле — но легко можно представить себе соразмерное их количество. Так что Гуглу тоже будет с чем бороться в ближайшие годы, и такой объем может вполне затормозить его развитие. К тому же с учетом параллельных задач, которые они изучают. Тут на днях написали, что нейросети Гугла после подключения к онлайн-переводчику «СОВЕРШЕННО СЛУЧАЙНО» создали первый «универсальный язык человечества»…

Поэтому не думаю все-таки, что за очередных два года они справятся и сопрут какой-нибудь очередной артефакт у бактерий быстро осознают и адаптируют то, что скопировали — всем «сеошникам» время подготовиться переродиться еще есть. Я лично уже давно в процессе — а вы? Записались ко мне на курсы? ;)

Вам понравится

комментария 3

  1. В продолжение темы про узлы: http://polit.ru/article/2013/06/01/dna/

    Мы знаем, что вся плетенка – тривиальный узел, то есть, он распутывается. Отрежем часть и замкнем то, что осталось. Помнит ли кусок, который остался, что он был частью незаузленного кольца, то есть незаузленной петли? Это то же вопрос, который мы задавали про возвращение в исходную точку на дереве: если мы знаем, что вся траектория не зацеплена, какая сложность у узла, который находится где-то на половине? Ответ такой: помнит, и очень хорошо. Если бы не было условия, что «родительский» узел тривиальный, если бы мы просто поинтересовались, с какая сложность у случайно сгенерированного узла, то мы получили бы очень сильно зацепленные пути. Но для условных распределений любой кусок, которой отрезан от тривиального узла, всегда оказывается слабо заузленным. Давайте подумаем, как можно в пространстве уложить нить так, чтобы, какой бы кусок мы от нее ни взяли, на нем бы было мало узлов? … Удивительным образом именно эта штука, во всяком случае, так показывает теория, и отчасти так получается в эксперименте, живет и является стабильной. … Почему такая укладка важна? Она очень мягкая. Она обладает удивительными свойствами, в частности, свойствами упругости. И, кроме того, попробуйте вытащить часть цепи из этой структуры. Из-за того, что она сложена в складки и не перепутана, вытащить кусок очень легко. Это означает, что для транскрипции ДНК очень легко вытаскивать достаточно длинные участки этой цепочки и потом быстро убирать их назад. Если вы попытаетесь вытащить петлю из равновесной глобулы, то вам придется побеспокоить практически все мономеры, потому что она очень сильно зацеплена. Если вы вытаскиваете петлю из фрактальной глобулы, то это происходит локально. Чтобы вытаскивать быстро и обратимо, надо иметь фрактальную (складчатую) глобулу.

  2. И еще две ссылки про Crispr:
    CRISPR на зубах http://polit.ru/article/2016/09/08/ps_jansson/
    Как бактерия распознает чужих http://polit.ru/article/2015/04/16/ps_crispr/

  3. Яндекс запустит поиск по ДНК — новость 2015 года, оказывается такие планы были.
    http://kommersant.ru/doc/2855640

    «Yandex Data Factory (подразделение «Яндекса», оказывающее услуги обработки «больших данных», big data), AstraZeneca и Российское общество клинической онкологии начинают тестирование платформы RAY для хранения и обработки данных геномного секвенирования»

    это совсем другой поиск по сравнению с описанный выше в статье, конечно, тем не менее, направление мысли понятно, да?)

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

15 − восемь =

Нужны советы по продвижению сайта? Подпишись сейчас!