Loading...
Рекуррентные нейронные сети (RNN) умеют работать с последовательностями данных, например с текстом, речью или временными рядами. В отличие от обычных нейросетей, которые обрабатывают данные по отдельности, RNN запоминают информацию о предыдущих шагах и используют ее для анализа текущих данных. Благодаря этому RNN хорошо подходят для распознавания речи, перевода текста, предсказания слов и других задач, в которых важен порядок и связь между элементами.
Ученые рассмотрели, как обучение искусственных нейронных сетей на простых задачах влияет на их способность решать более сложные.
В эксперименте с животными команда учила лабораторных крыс искать воду в коробке с несколькими отделениями. Для успешного поиска животные должны были понять, что подача воды связана с определенными звуками и световыми сигналами, а также научиться ждать некоторое время после этих сигналов, прежде чем пытаться получить воду. Таким образом крысы сначала осваивали базовые навыки — распознавание звуков и света, а затем учились комбинировать их для достижения цели — получения воды.
Исследователи перенесли эту идею на обучение рекуррентных нейронных сетей (RNN). Вместо поиска воды сети выполняли задачу ставок, где им нужно было на основе простых решений постепенно выстраивать стратегию для получения максимального выигрыша. Такой подход, названный «обучением по программе детского сада» (kindergarten curriculum learning), предполагал сначала обучение сети простым подзадачам, а затем их объединение для решения сложной задачи.
Результаты показали, что RNN, обученные по этой методике, осваивали сложные задачи быстрее и эффективнее, чем сети, обученные традиционными способами. Кроме того, такие сети лучше имитировали поведение животных, включая способность делать долгосрочные выводы о скрытых состояниях и принимать решения на основе оценки ценности.
Механизм улучшения обучения связан с появлением в сети медленных динамических процессов, которые необходимы для анализа и принятия решений на основе накопленного опыта. Эта методика помогает искусственным нейронным сетям приобретать ключевые свойства, необходимые для моделирования сложного поведения, требующего сочетания нескольких когнитивных функций.
Таким образом, ученые показали, что обучение ИИ по принципу постепенного освоения простых умений, как у детей в детском саду, значительно улучшает его способность решать сложные задачи и приближает поведение искусственных систем к поведению живых организмов.
«Агенты искусственного интеллекта сначала должны пройти детский сад, чтобы позже иметь возможность лучше усваивать сложные задачи. Эти результаты указывают на способы улучшения обучения в системах искусственного интеллекта и требуют развития более целостного понимания того, как прошлый опыт влияет на освоение новых навыков», — говорит Кристина Савин из Нью-Йоркского университета.
Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram, Одноклассники.