![]() |
|
![]() |
#1 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9824 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() Мои первые шаги по созданию искусственного интеллекта. Все началось с того, что я решил создать робота помощника. У меня не было желания собирать просто игрушку, которая каталась бы по квартире и ничего полезного не выполняла. Я твердо для себя решил что робот должен приносить пользу, иначе это не робот, а просто бесполезная железка. Не буду описывать подробности и детали всего этого процесса, остановлюсь лишь на том что я дошел до создания командного процессора, это такая программа которая должна распознавать голосовые команды и выполнять их. Вот тут я и столкнулся с трудностями распознавания. Прочитал кучу литературы по нейронным сетям. Написал кучу тестовых программ для общего понимания и развития, даже написал программу которая распознает отдельные фразы и графические образы, программа прекрасно распознает отдельные фразы, но научить ее что бы она распознавала предложения у меня так и не получилось. Вернее предложение распознать можно целиком, но выделять из него слова я не смог. Сказывается недостаток знаний в этом направлении. В итоге было решено использовать распознавание речи от Google. Программу переписывал несколько раз менял ее алгоритм и наконец, мне удалось нарисовать алгоритм речевого обучения и общения. Программа теперь может обучатся как человек в младенческом возрасте и для ее обучения не нужно использовать клавиатуру с мышкой, все обучение происходит через речевое общение. Так как алгоритм основан на нейронных сетях то скорость и реакция не зависят об размера базы диалогов. В основном большая часть времени у программы уходит не на распознавание, а на запись звукового файл и на его отправку в облачный сервис Google, только потом после получения от Google текста, программа сопоставляет предложения и находит на не него лучший ответ. Работа над программой продолжается. Прошу помощи всех у кого есть опыт работы в этом направлении. Плоды моего творчества можно увидеть на видео. |
![]() |
![]() |
![]() |
#2 |
Junior Member
Регистрация: 27.05.2012
Возраст: 51
Сообщений: 7
Вес репутации: 0 ![]() |
![]()
Я думаю вы знаете эту ссылку, но на всякий случай (http://ab-log.ru/smart-house/speech/speech-recognition). Там так-же есть некоторая информация по поводу нейронных сетей. От гугла отказываться пока нет смысла их сервера действительно качественно распознают наш "великий и могучий". Сколько мне попадалось офлайн вариантов, все как-то коряво работают.
|
![]() |
![]() |
![]() |
#3 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9824 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]()
Google использует распознавалку от компании Nuance.
Есть программа Dragon от Nuance, проблема только в том, что ее нужно обучать и еще к тому же разными голосами. На это может уйти очень много времени. В процессе изучения ИИ, пришел в выводу что без визуально ассоциативной части ИИ не создать. ИИ при общении, должен рисовать образ у себя в мозгах, каждое слово должно ассоциироваться с графическим образом. Также у человека с образами ассоциируются запахи, вкусы, тактильное ощупывание пальцами рук и т.д.. Только тогда ИИ сможет думать и отвечать осмысленно на вопросы. Примерно так: Мы обучаем ИИ графическим примитивам-окружность. И соответственно ассоциируем примитив с разными фразами : круг, окружность, обруч, кольцо и пр. В итоге после обучения ИИ начнет понимать значение слов круг, обруч, кольцо и рисовать окружность и наоборот при виде окружности ИИ сможет ответить словами круг, обруч, кольцо или окружность |
![]() |
![]() |
![]() |
#4 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9824 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]()
На данный момент занимаюсь созданием многослойной, масштабируемой нейронной сети, способной распознавать ч/б визуальные образы. На вход нейросети будут подаваться изображения 176х132 пикселей с 16 полутонами, предварительно обработанные.
Как закончу о результатах отпишусь |
![]() |
![]() |
![]() |
#5 |
Junior Member
Регистрация: 29.09.2012
Сообщений: 1
Вес репутации: 0 ![]() |
![]()
Будет очень интересно посмотреть на результат. Ждем с нетерпением.
|
![]() |
![]() |
![]() |
#6 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9824 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]()
Проект пока отложил. Как появится время возобновлю
|
![]() |
![]() |
![]() |
#7 |
Senior Member
Регистрация: 02.04.2012
Адрес: Питер
Сообщений: 1,125
Вес репутации: 1312 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]()
Доиграешся ты до истории с Терминатором!!!
![]() ![]() ![]() |
![]() |
![]() |
![]() |
#8 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9824 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]()
Хочу перенести проект на роутер с прошивкой OpenWrt
Распознавалку сделал, но не знаю как изменить default настройки в Alsa драйвере. А именно Sample rate, у меня от 44100 и роутер очень долго его конвертирует в формат Flac. Если сделать ресемплинг то роутер начинает тормозить Может быть есть идеи? |
![]() |
![]() |
![]() |
#9 |
Senior Member
Регистрация: 06.11.2012
Сообщений: 153
Вес репутации: 0 ![]() |
![]()
ну тут тоже как с распознаванием видео - нужен ББ..
а откуда вы звук с роутера берете ? с вебкамеры ? |
![]() |
![]() |
![]() |
#10 |
Administrator
Регистрация: 12.04.2010
Адрес: Москва
Сообщений: 9,618
Вес репутации: 9824 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]()
Да, с веб камеры. Можно и с USB звуковой карты брать
|
![]() |
![]() |
![]() |
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1) | |
Опции темы | Поиск в этой теме |
Опции просмотра | |
|
|