Перевести на Переведено сервисом «Яндекс.Перевод»

Scientific Problems

Log in or sign up the website to add a comment to the science problem you are interested in!
Subject

Программист Анатолий Старостин о компьютерных методах в лингвистике, онтоинженерах ABBYY и семантическом поиске



В проекте ScienceHub главный редактор проекта ПостНаука Ивар Максутов беседует с учеными в их лабораториях о новых технологиях, перспективах исследований и новых профессиях, которые появятся благодаря научным открытиям.


ПостНаука побеседовала с Анатолием Старостиным, руководителем группы семантического анализа в ABBYY, преподавателем кафедры «Компьютерная лингвистика» в МФТИ, чтобы разобраться, как работает семантический поиск, какие основные направления компьютерной лингвистики есть сегодня и кто важнее, математики или лингвисты.


Компьютерная лингвистика — это область научного знания. Это наука, с одной стороны, о языке, а с другой стороны, о том, как работать с языком (не всегда естественным) с помощью компьютерных методов. Это наука, возникшая на стыке лингвистики и computer science. Компьютерная лингвистика под разными углами рассматривает естественный язык, формальный язык. В центре этой науки — понятие языка, которое можно рассматривать с разных сторон. Его можно рассматривать, например, формально.


Подготовка лингвистов с оглядкой на компьютерную лингвистику существенно влияет и на самих лингвистов. Более или менее современные лингвисты сегодня (если говорить о людях, которые занимаются естественным языком, пишут теоретические работы об этом) давно перешли на представления о компьютерных методах. В качестве примера я могу упомянуть «Национальный корпус русского языка». Это известный публичный ресурс, который был создан лет десять назад. Это корпус русского языка, размеченный разной лингвистической метаинформацией. Там есть морфологическая разметка, синтаксическая разметка и так далее.


Грубо говоря, компьютерная лингвистика становится инструментом извлечения информации оттуда, откуда мы ее до этого не могли извлечь. Если кто-то положил в структурированную базу данных, мы взять можем, потому что они структурированы. Надо только разобраться в формате, то есть в том, как они их выложили. А если это написано текстом, то, казалось бы, это может понять только человек. Оказывается, что с помощью таких методов можно написать программы, которые поймут вместо человека. Это, грубо говоря, конвертеры неструктурированной информации в структурированную.


Источник: http://postnauka.ru/tv/19248

from Sergey Zamaletdinov 15.11.2013 00:00
0

Константин Агладзе об электрофизиологии, исследовании возбудимых систем и сердечных вихрях




В проекте ScienceHub главный редактор проекта ПостНаука Ивар Максутов беседует с учеными в их лабораториях о новых технологиях, перспективах исследований и новых профессиях, которые появятся благодаря научным открытиям.


ПостНаука побывала в лаборатории Константина Агладзе «Наноконструирование мембранно-белковых комплексов для контроля физиологии клетки» в МФТИ, чтобы подробнее разобраться, чем занимаются биофизики, какие есть современные подходы к изучения сердца и нужны ли IT специалисты в этой области.


Биофизика — это то, чем занимаются физики, когда исследуют биологические объекты. Существует много определений биофизики. Одно из них — исследование биологических объектов физическими методами. Но мне нравится, когда впереди стоят люди, а не аппаратура, потому что у тех физиков, которые конкретно обучались физике, особенно в России и в бывшем Советском Союзе, мышление построено немного иначе, чем у классических биологов. Эти люди занимаются биофизикой. Если биофизика — это исследование живого физиками, то это совершенно безбрежная область, которую можно по уровням, слоям проследить. В молекулярной биологии измерения на уровне молекул. Это все уже смыкается с химией. И там нельзя провести четкой границы между тем, что делают химики — высокомолекулярные соединения, и что делают биологи и исследователи молекулярной инженерии, когда смотрят какие-то тонкие вещи.

Поскольку основных возбудимых систем в живом теле две – это нервная и сердечная, если пищеварительную не брать (это детали), — мы занимаемся частью этого – сердечными тканями. А для чего это делается? Интересны не ткани сами по себе, а функционирование сердца. Мы все знаем, что повреждение сердца вызывает практически мгновенную или очень быструю смерть. И как это всегда было известно начиная с древнего эпоса: «поразил стрелой в сердце». Две вещи: отрубил голову – все, кранты. Попал в сердце – тоже плохо.


С одной стороны, мы понимаем, что есть много общего между крысиным сердцем и человеческим. Если бы этого общего не было, то и биофизики сердечной не было бы. Но дело в том, что есть большая разница. И мы, например, сами на эту разницу наткнулись. Мой японский аспирант, который делал эту работу, использовал обычный японский диаритмик, дал его в культуру сердечных клеток крысы, чтобы увидеть, что произойдет; он ничего не увидел. И, когда мы стали с этим разбираться, выяснилось, что очень широко используемые диаритмики третьего класса будут работать только на человеческих клетках, потому что у них есть специальные ионные каналы, которые блокируются этими диаритмиками. А вот у крыс этих ионных каналов нет. Казалось бы, довольно очевидная вещь, но она получила такое неожиданное подтверждение. То есть если мы хотим разрабатывать лекарство для человека, мы должны использовать человеческие ткани.


Источник: http://postnauka.ru/tv/19242

from Sergey Zamaletdinov 13.11.2013 00:00
0

Математик Андрей Райгородский о структуре графа, вопросе надежности компьютерной сети и о том, как ловить спам




В проекте ScienceHub главный редактор проекта ПостНаука Ивар Максутов беседует с учеными в их лабораториях о новых технологиях, перспективах исследований и новых профессиях, которые появятся благодаря научным открытиям.


ПостНаука побывала в отделе теоретических и прикладных исследований компании «Яндекс», которым руководит Андрей Райгородский, чтобы подробнее разобраться в теории графов, понять, как она работает в мире современных технологий, и узнать, кто спасет нас от спама в будущем.


Для человека, который совсем не знает, что такое граф, правильно рассказывать в совершенно конкретных терминах. Представьте себе, что у вас есть большая пространственная молекула, которая состоит из жестких шариков, не важно, из чего сделанных (из картона, из металла). И эти шарики между собой перелинкованы, то есть соединены проволочками, прямолинейными отрезками. Получается жесткая конструкция, которую в математике принято называть графом. Это чисто наглядная интерпретация — в виде молекулы. Хотя мне думается, она кажется удобной всякому, кто пытается представить, что такое граф. Абстрактно же граф устроен таким образом: у него есть множество вершин и множество ребер. Собственно, те шарики, которые мы видим в пространстве, — это вершины графа. А проволочки, которые их соединяют, — это ребра графа. Если говорить в абстрактных терминах, вершины — это просто некоторые конечные множества каких-то элементов.


Известно, что во всех социальных сетях и в интернете в том числе выполнен закон шести рукопожатий. То есть в математических терминах диаметр этого графа очень маленький. Между любыми двумя вершинами есть короткий путь, который их соединяет. В социологическом плане это рукопожатия по знакомствам. А в интернете — это скорее клики компьютерной мышкой по ссылкам, которые есть на сайтах. То есть мы можем, двигаясь по ссылкам с одного сайта на другой, в конце концов перейти с одного сайта на другой. Это сделать можно за очень короткое количество операций. Так что есть еще такое замечательное свойство. Но и масса других свойств, которые имеют значимое практическое применение.


Мировые специалисты в области теории случайных графов берутся, естественным образом, из тех, кто занимается как комбинаторикой и теорией графов, так и из тех, кто занимается теорией вероятности и случайными процессами. Это интересные темы. Вообще говоря, сейчас эта область очень бурно развивается. Есть огромное количество лабораторий. Кафедр, которые пропагандируют такую науку во всем мире.


Источник: http://postnauka.ru/tv/19240

from Sergey Zamaletdinov 08.11.2013 00:00
0

Микробиолог Константин Северинов о том, что нас ждет в будущем благодаря современным исследованиям в микробиологии, биоинформатике и геномике



В новом проекте ScienceHub главный редактор проекта ПостНаука Ивар Максутов беседует с учеными в их лабораториях о новых технологиях, перспективах исследований и новых профессиях, которые появятся благодаря научным открытиям.


ПостНаука побывала в лаборатории молекулярной генетики микроорганизмов Института биологии гена РАН Константина Северинова, чтобы подробнее разобраться в том, что такое синтетическая микробиология, и посмотреть, чем занимаются исследователи в этой области прямо сейчас и к чему это приведет в будущем.


Синтетическая микробиология — это такая новая наука, надо понимать, что разные люди вкладывают совершенно разные значения, когда они про это говорят. С одной стороны, она возникла тогда, когда какое-то количество физиков и математиков по старой памяти решило заняться микробиологией. Всякий раз, когда в физике или математике начинается кризис — им больше нечего искать: ни теорему Ферма доказывать, ни бозона Хиггса, — они идут в биологию и начинают там что-то делать. Это хорошо. И результатом такого рода деятельности стало то, что физики задались вопросом, как именно контролируется работа генов в клетке. Биологи тоже этим занимались, но физики подошли к этому с другой стороны: они стали моделировать эти процессы, использовать различные методы вплоть до дифференциальных уравнений, чтобы описать процесс работы генов в клетке.


И если ты понимаешь, как это работает, то ты знаешь, как его можно контролировать. И выяснилось, что в ряде случаев можно, в зависимости от ряда условий, которые они же сами и контролируют, изменять спектр генов, работающих в клетке, биологически активные вещества, которые клетка производит и так далее. Это одна часть синтетической биологии. Другая синтетическая биология очень высокого технологического уровня — это наука, которую продолжает развивать Крейг Вентер, человек, который отсеквенировал геном человека, самого себя. И эта наука заключается вот в чем: если мы можем определить геном, то есть совокупность последовательностей всего гена организма, а это ДНК, то никто не мешает нам, в принципе, такую молекулу ДНК создать синтетически, самим. Она будет очень длинная, но мы ее сделали сами. 


Потом такую молекулу ДНК можно поместить в клетку, в которой своей генетической информации нет, и возникнет новая клетка, которая запрограммирована так, как ее создатель, в данном случае ученый, сделал.


Над нами сгущаются тучи, потому что увеличенная продолжительность жизни и все то, что мы теперь воспринимаем как данность, — это то, чего раньше не было, это все возникло в 30-40-е годы и началось с введения в практику антибиотиков. Это вещества, которые производят определенные бактерии для борьбы друг с другом. А так получилось, что мы научились их использовать для борьбы с бактериями, которые вызывают болезни, но, к сожалению (а на самом деле естественно), стали появляться формы бактерий, устойчивые к антибиотикам, и в недалеком будущем может оказаться, что все антибиотики, которыми мы пользуемся, сейчас неэффективны. Это будет грандиозный коллапс.


Источник: http://postnauka.ru/tv/19239

from Sergey Zamaletdinov 06.11.2013 00:00
0
1 ... 7 8 9 10