InScience

В 1976 году компании Рэймонда Курцвейла, выпускника Массачусетского технологического института, было два года. Ее основателю, рано полюбившему изобретательство и программирование (с которым его познакомил дядя, работавший в Лаборатории Белла), — 28. В 15 он написал свою первую компьютерную программу, а в 17 со своими работами уже побеждал на конкурсах и участвовал в телешоу. (А еще был большим любителем научной фантастики, он об этом чуть позже.) Учась в МТИ, он создал программу, помогающую студентам с выбором колледжа. Этот аналог Распределяющей шляпы сравнивал ответы студентов с заданными характеристиками колледжей. Чуть позже он продаст ее за $100 000.

Вторым его начинанием стала компания Kurzweil Computer Products, занимавшаяся разработкой первой системы распознавания символов, которая могла бы работать с различными шрифтами. Работа шла не на пустом месте: идеи и прообразы существовали с конца XIX века. Один из них — оптофон, изобретенный в 1913 году ирландским физиком Эдмундом Фурье Д’Альбой. Этот прибор мог считывать печатный текст и издавать звук определенной высоты и продолжительности, особый для каждой буквы. Скорость работы первых образцов составляла всего одно слово в минуту, хотя и выросла позднее. Другое устройство, «Гизмо», сконструировал американский математик и инженер Дэвид Шепард. Его машина разбирала специально созданный шрифт, Farrington B, использующийся и сейчас на банковских картах. В 1966 году появилась машина IBM 1287, способная распознавать рукописные цифры.

В основе машины Курцвейла лежала разработанная им система распознавания графических символов. О том, как ему пришла идея о ее возможном применении, Курцвейл писал так: «Однажды я сидел в самолете рядом со слепым мужчиной, и он рассказал, что единственное настоящее препятствие для него — это невозможность читать отпечатанные материалы. Тогда я понял, что это — та задача, которую мы искали. Мы могли применить нашу "omni-font" (подходящую для любого шрифта) технологию по распознаванию символов для того, чтобы преодолеть эту трудность». К концу 1975 года машина, которая могла распознавать символы и воспроизводить текст в виде аудио, была готова. Работало это так: человек клал лист бумаги с текстом на сканер, нажимал на кнопку и слушал синтетическую речь. Получалось примерно 150 слов в минуту — обычная скорость разговорной речи.

В работе машины участвовало три системы: первая из них сканировала текст, пробегая его построчно, вторая собственно распознавала слова, анализировала сложные случаи (стертые или не полностью пропечатанные буквы), третья отвечала за синтез речи (text-to-speach), она использовала большой набор правил произношения и словарь исключений. Машина позволяла сделать паузу или повторить отрывок. Специальный режим озвучивал функцию кнопки при нажатии на нее.

Демонстрация устройства прошла на пресс-конференции 13 января 1976 года. Как вспоминал Курцвейл, в тот вечер о ней говорили во всех новостях. Первым покупателем машины стал певец Стиви Уандер. О создателях машины он узнал после того, как они выступили с ней в телешоу, и быстро связался с опешившими от такой встречи изобретателями.

В 1980 году компания была продана Xerox, после чего Курцвейл несколько лет оставался в ней консультантом. К 2008 году машина стала похожа на сотовый телефон массой в 100 граммов и знала семь языков.

Уандер стал тем, кто сподвиг Курцвейла разработать музыкальный синтезатор, звук которого был бы неотличим от настоящих инструментов. Курцвейл основал новую компанию, и дело опять пошло неплохо.

Среди других его проектов: система распознавания устной речи, образовательные программы для медработников, фонд для разработки алгоритма вложения средств. Также он автор нескольких книг, в частности о технологическом прогрессе, его ускорении и перспективах развития цивилизации.

Большое внимание к личности Курцвейла привлекли его предсказания. В интервью, лекциях и публичных выступлениях он высказывает свои предположения о том, в каких направлениях и как быстро будут развиваться технологии. Пример такого прогноза: «Уже сейчас мы видим, как искусственный интеллект становится мейнстримом с созданием суперкомпьютера Watson IBM, помощника Siri, поисковика Google Now и беспилотных автомобилей. <…> Следующий шаг неизбежен, наш мозг соединится с созданными нами интеллектуальными технологиями. Где-то к 2030-м годам наноботы в нашей крови и мозге сделают нас здоровее и умнее, а большая часть мыслительных процессов будет проходить в "облаке", свободная от естественных ограничений нашего мозга. Это позволит нам легко "откатываться назад" и ускорит обучение».

В 1990 году он обещал, что в течение десятилетия компьютер станет обыгрывать лучших игроков в шахматы (что и произошло в 1997 году). Он предсказывал очень быстрый рост интернета и электронных книг, появление беспилотных автомобилей. Он полагает, что к середине XXI века человечество обзаведется технологиями, которые позволят оживить последователей крионики, будет существовать Мировое правительство, а компьютер пройдет тест Тьюринга (то есть станет настоящим искусственным интеллектом). По его оценкам, к 2019 году человек будет общаться с компьютером посредством диалога и жестов, клавиатуры будут не нужны, широкое распространение получат нейросети. Машинный перевод станет достаточно совершенным, чтобы использоваться повсеместно, как и роботы, помогающие с работой по дому, а также персональные помощники. Ничего сверхъестественного, правда?

Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.

Тэги #История науки

Поиск

Подписывайся

Последние новости