Nevereno vliz

";} ?>
Интелигентни и невронни мрежи

Проф. Руси Маринов, д.н.

 

Резюме: В студията се дискутират нови тенденции за усъвършенстване на интелигентните средства и в частност структурата, характеристиките и приложенията на невронни мрежи, които все по-широко се използват в областта на бизнеса, военната сфера, сигурността, медиите и компютърните игри. Тези мрежи са по-нататъшно  усъвършенстване на иновативни технологии като машинно обучение и дълбочинно ученe, системи с изкуствен интелект и смарт инфраструктури.

Ключови думиневронни мрежи; кибернетика; интелигентна мрежа; когнитивни компютърни системи; машинно обучение; смарт инфраструктури;

 

Intelligent and Neural Networks

 

Prof. Rusi Marinov, PhD, D. Sc.

e-mail: 

 

Summary: In this study, we will discuss new trends for improvement the intelligent tools, and the structure, characteristics and applications of neural networks that are increasingly used in business, military, security, media and games. These networks are the further development of advanced technologies such as machine learning and deep learning, AI and smart infrastructure.

Key words: cybernetics; neural networks; artificial intelligence; cognitive systems; machine learning; smart infrastructures;

Бъдещото развитие на съвременните общества е свързано с няколко високо технологични направления като  усъвършенствани смарт инфраструктури; машинно обучение; дълбочинно учене; графичен анализ; представяне на знание; анализ на образи и обекти; разпознаване на реч; виртуални персонални помощници; модели за симулация; роботизирани системи; визуализация на сцени; сензори като част от интернет на обектите; и управление на процеси, с помощта на естествен език. Институтът "Гартнър" [1] през 2017 г. очертава няколко тенденции за  усъвършенстване на интелигентните устройства и приложение в бизнеса до 2020 г. Твърди се, че развитието на изкуствения "интелект" и машинното обучение достигат критични точки, което позволява да се засили влиянието на технологии, свързани с виртуална и допълнена реалност и интегрират смарт средства в различни услуги, обекти и приложения. По-долу ще изброя някои от направленията за развитие на технологиите:

o   Иновативни средства за машинно обучение от типа на  дълбочинно учене, невронни мрежи, управление на процеси с помощта на  естествен език. Това води до създаване на усъвършенствани машини, които разбират нещата и респективно въпросите, учат се, предсказват бъдещи процеси и се адаптират към реалността. В случая системите могат да станат както  "по-умни", така и да променят бъдещото си състояние, тоест създават се условия за  по-интелигентни устройства и програми. На бизнес равнище развитите организации, с помощта на горните технологии могат да подобрят качеството на сценариите, експериментите и ценностите в бизнеса.

o   Интелигентни, мобилни приложения като тук се включват виртуални персонални помощници, с потенциал да трансформират работното място,  служителите да станат по-ефективни, да се очертават по-лесно важни задачи и съдържание за деня, автоматична обработка на е-поща и взаимодействие. Тук усилията се концентрират в следните направления: напреднали аналитични инструменти, AI-автономни бизнес процеси, формиране на имерсивни среди и интерфейс настроен към разговори. Към 2018г. се очаква повече от 200 водещи компании да използват подобни приложения, с което ще се подобри процеса по обработка и  анализ на данни.

o   Интелигентни обекти – в случая може да се говори за три категории средства като роботи, дронове и автономни автомобили. Устройствата като част от IoT  ще се интегрират по-интензивно в офиси, фабрики, къщи, медицински структури.

o   Виртуална и допълнена реалност – води  до  трансформация на  взаимодействието между хората и изграждане на имерсивна среда. VR може успешно да се използва за разработване и проверка на сценарии. AR свързва обикновено реални и виртуални елементи, което за бизнеса означава да се осигурят  допълнителни графични елементи към реални обекти от типа например на  скрити електропроводи и стени.

o   Дигитални двойници: очаква се в рамките на 3-5 години милиарди обекти да бъдат представени, под формата на динамични софтуерни модели на физически системи. Съчетават се реални данни от сензори и  симулирани такива. Подобни технологии ще се използват за анализ на реални ситуации,  осигуряване на отговор за промени в средата, подобряване на бизнес операциите, добавяне на допълнителни ценности към фирмените дейности. Това изисква и промяна на културата на поведение на хората, особено на тези  които се занимават с науката за данни и ИТ специалистите. Дигиталните двойници на физически активи, комбинирани с цифрови репрезентации на среди или на процеси, хора и бизнеси води  до по-висока степен на  анализ на физическия свят, симулация и контрол.

o   Системи /Вж. Годишник „Масови комуникации”, 2015 г. http://bit.ly/2wVbSMC/ ориентирани към разговор, което води към по-комплексна интеракция между хората и машините като например  в криминологията се събират и обработват данни за свидетели и заподозрени. В случая при тези системи не се използва текст,  а основно разговор с програмата и други възможности за взаимодействие  като знаци, тактилен допир, звуци, като се осигурява контакт със сензори, приложения и IoT системи.

o   Мрежа от приложения и архитектура ориентирана  към услуги. Например архитектура от типа на "MASA" е мултиканална система, която използва едновременно облачни ресурси, микроуслуги, контейнери, и специални API модули, осигуряват се още гъвкави и динамични  решения. Нови тип смесени мрежи (mesh): формиране на динамични връзки между хора, процеси, обекти и услуги поддържани от интелигентни, дигитални екосистеми- като в случая се  трансформират архитектурите за сигурност и платформите за бизнес.

Технологии които кореспондират с интелигентните структури са няколко като: невронни мрежи (neural networks); големи данни (big data); машинно учене (machine learning-ML); извличане на данни (data mining); алгоритми(algorithmes); модели (models). Например, ML включва теми като: дълбочинно учене; използване на естествен език за команди; разпознаване на лица;  усилено обучение (reinforcement learning);  програмата „алфа го“ на Гугъл; самоуправляващи се автомобили. Началото на тези тенденции е поставено още през 40-те годни на 20. век, когато Норбърт Винер разработва комуникационна теория и формулира принципите  на кибернетиката. След войната събира група от млади изследователи, специализиращи в областите на изкуствен  интелект, компютърни  науки и невропсихология. Разработва и теория, свързана с комуникационното инженерство и през 1943 г., развива основите на  кибернетиката, роботиката, компютърен контрол и автоматика. През 1947 г. популяризира името "Cybernetics" и формулира стандартна терминология в тази област. Превръща се в първия учен в света, който се занимава с електронна комуникация и контролни системи. През 1948 г. публикува и знаменитата си книга  "Кибернетика или контрол на живите организми и  машините". През 1954 г. публикува труда "Кибернетика, общество – човек". Кибернетиката е дефинирана като наука за комуникация и контрол на машините и живите организми. Терминът кибернетика произхожда от гръцки "kybernetes"- управлявам кораб.

Книгата „Кибернетика: или контрол на  машините и живите организми“ общо е издавана 4 пъти от различни издателства,  като две от изданията са публикувани от MIT press. Cambrige, Massachusetts (1985, 1965). В тази книга Норбърт Винер посочва, че идеята за самообучаващите се машини е толкова стара, колкото и самата кибернетика. Например в оригиналното издание от 1948 в книгата  има 8 части, като пета носи названието "Изчислителни машини и нервна система". В изданието от 1961г. се добавя частта "За обучаващите се и самовъзпроизвеждащи се машини". Формулират се и някои правила за изграждане на самоорганизиращи се машини и се твърди, че компютърната машина трябва да бъде  числова и машината да реализира  всички операции сама, тоест след въвеждане на данни, човек не трябва да се намесва до крайния резултат; за програмиране да се използва двоична скала (0, 1) вместо десетична. Машините да притежават специален апарат, където се съхраняват данните, като от паметта всички данни да се извличат максимално бързо, да могат също така бързо да бъдат да се преглеждани. За разлика от схващанията на Шанън, тук се въвежда понятието “количество информация", с помощта на която, се измерва степента на организация на системата, докато с ентропията могат да се измерват степените на дезорганизация. Количеството информация се свързва с единица информация, която се предава като сигнал, като информацията се свързва с едно единствено решение, което се взема между равнопоставени, вероятни алтернативи. Като цяло всяка компютърна машина притежава своите предимства, защото машинните методи са по-бързи от ръчните. Компютърната машина да бъде основана на логическо мислене, тоест всички данни въведени в машината да бъдат свободни  за интервенции от хората. Предлага се за целите на програмиране да се използва булева алгебра. Така че всички данни въведени в машината, независимо дали са цифрови или логически са под форма на мрежа от избори между две алтернативи и всички операции с данни приемат формата на мрежа от нови избори зависещи от мрежата на предишния избор. Паметта е важна част от машините или това е способността да се запазват резултати от минали операции, за да се използват в бъдеще.

Според Винер [2] можем да говорим за съществуване на два типа компютърни машини: първия тип са подобни на  "диференциалния анализатор" на Ваневар Буш или още са известни като аналогови машини, където данните са представени под формата на измерване на една непрекъсната скала, така че точността на машината се определя от  конструкцията на измерителната скала; и втория тип машини, които са и мултифункционални се наричат цифрови машини, при тях данните са представени под формата на  "мрежа от избори", сред тези избори има и поредица от случайни процеси. Точността на машините се определя от обстоятелството при което случайните процеси са забележими или броят на алтернативните случайности са налице във всеки избор. Може да се твърди, че за високо точните машини, цифровите функции са за предпочитане и следователно всички подобни машини трябва да бъдат конструирани и базирани на бинарна скала, където броят на алтернативите, представен във всеки избор са само две.

Модел на кибернетична система: – система – външна среда – обратна връзка. Обратната връзка включва информация, относно промените във вътрешната и външна среда, водеща до промяна на системата и  адаптацията към средата. Известни са два типа обратна връзка: негативна-реагира на промяната в средата и позитивна-засилва промяната. Същността на негативната връзка [3] се заключва в това, че посоката на въздействие е ориентирана към промяна на средата, с последваща противодействие на промяната (Вж. схемата).

Приложение на кибернетичната теория: преодоляване на ефектите от липса на комуникация и изграждане на устойчив контур за обратна връзка; автоматизация на процесите; наблюдение на работата на хората; въвеждане на системна философия в практиката; изграждане на киберкултура.

Основни идеи на Винер: интегриране на обратната връзка във  външната среда; негативната връзка поддържа наложилата  се структура в средата, като противодейства  на всяка промяна в средата; позитивната връзка често пъти води до разрушаване на системата. Целта на кибернетиката е да развива език и техники, които позволяват на  хората да решават проблеми, с помощта на контрол и комуникация. Тази технология  още позволява да се комбинират и класифицират идеи и техники, водещи до организиране на средата. Основна функция на комуникацията е да предава информация и контролира средата, в която живеем. Новата технологична тенденция, наречена „информация за всичко“,включва както дигитални форми на продукция, използване и  трансмисия на информация, така и генериране  на текст, аудио и видео. Тук се  включват и  данни от  сензорна и контекстуална информация. Информацията се превръща в стратегически ресурс като обхваща технологии, базирани на свързани данни от всички устройства или хора,  появяват се и коренно  различни източници на  информация, които допълват картината. Постиженията в семантичните технологии от типа на графични база данни, класификация на данни и аналитични техники за анализ допринасят за предаване на значение на често смятания хаотичен поток от данни и факти.

През април 2017 г. Масачузетския институт по технологии (MIT) дискутира приноса на университета за развитие на невронните мрежи. Прави  кратък преглед на историята на тази технология. Невронни мрежи [4] са дефинирани за пръв път през 1944 г., когато двама учени Уорън МакКолуг и Уолтър Пит от Университета в Чикаго се преместват в MIT и основават първия департамент в тази сфера. Невронните мрежи са описани от МакКолуг и Пит под формата на  отправни точки и тегловни стойности при сравняване на отделни параметри. Изследователите по това време не говорят за слоеве или механизми за обучение. Мрежата се дефинира като принципна структура, с основна цел изчисление на функции. В резултат се акцентира в по-голяма степен на невронауките, отколкото на компютърните технологии. Идеята е човешкия мозък да се разглежда като изчислително устройство. По-късно през 1957 г. е изграден модел на невронна мрежа,  която може да бъде обучена за извършване на  определена дейност и  демонстрирана от Франк Розенблат в университета "Корнел". По-късно невронните мрежи се превръщат в главно поле за изследване в сферата на науката за компютри и  невронауките. През 1969г. Марвин Мински и Сиймур Пейпърт създават  лабораторията по изкуствен интелект в MIT. Според разбирането на института невронната мрежа е средство за машинно обучение (Вж. Годишник на департамент "Масови комуникации" от 2016 г.), при този процес компютрите се научават да изпълняват определени задачи като анализират случаи от практиката. Примерите предварително се въвеждат от човека в паметта на мрежата. Например системата за разпознаване на образи съдържа хиляди снимки на автомобили, къщи, магазини за кафе и други в този порядък, в резултат на което мрежата самостоятелно може да открие  характерни черти на образи, които корелират със задачата. С други думи невронната мрежа може да съдържа хиляди, а в някои от случаите милиони процесори, които са взаимосвързани или  подредени под формата на слоеве. В последните години се наблюдава възраждане на идеята за невронни мрежи, тази революция е предизвикана от постиженията в сферата на "дълбочинно обучение", тоест на практика се достига до дизайн на мрежи с 50 и повече слоеве, разположени в паметта на системите в дълбочина. Например, в едно автономно превозно средство, без шофьор могат да намерят приложение три технологии/ машинно обучение, когнитивна система и невронна мрежа/, като  производителя трябва да избере коя от тях ще използва в автомобила.

 

 

 

Класическа схема [5] на невронна мрежа

 

 

           
   
 

Вход

 
   
 

 

 

 

 

 

 

 

 

 

 

Принципиалната схема на невронната мрежа е изградена от три информационни слоя, всеки с няколко "точки"; вход; изход и непрекъснати връзки (links) между слоевете.

Типичната структура на мрежата включва  няколко основни секции:

§ инфо точки като самостоятелни единици, които се активират при постъпване на входен сигнал;

§ връзки между отделните инфо-възли (nodes) или "точки";

§ функционални правила, които направляват процесите вътре в мрежата;

§ специална функция за обучение на мрежата като се преценява стойността на сигнала на входа и изхода.

За практически цели, биха могли да се игнорират множеството слоеве в мрежата и да се използват основно три елемента (вход, базов слой, изход), след което се задават определени задачи на входа, притежаващи математически стойности и като се използва един популярен алгоритъм в професионалната сфера, наречен „backpropagation“ може да се тренира мрежата хиляди пъти, относно получаваните резултати  на изхода, така че грешките, например, при разпознаване на обекти да бъдат сведени до минимални отклонения. Обучението на мрежата става по компютърен път, със специален код и е доста опростен процес, всичко се случва под формата на игра. Алгоритъмът backpropagation  е разработен през 1970 г. като неговото приложение започва след публикацията през 1986 г. на Дейвид Румелхарт,  Джеофри Хинтън и Роналд Уйлямс. В изследването им се описват функциите на  няколко невронни мрежи, където се използва този алгоритъм за обучението им и процесът е много по-бърз, отколкото използване на други методи. Като резултат се появява възможността, с помощта на невронна мрежа да  се дефинират проблеми, които дотогава са били неразрешими.

Невронните мрежи са изградени от прости елементи, работещи паралелно. Тези елементи са вдъхновени от биологичните нервни системи. По дефиниция мрежата функционира като осигурява връзка между много бройни отделни електронни части. Мрежата може да се обучи да изпълнява частни задачи като се настройват отделните елементи да работят в синхрон. Специфични входни данни водят до точно  определен резултат. Подобна ситуация е изобразена на схемата по-горе. Mрежата се самонастройва като се измерва отклонението на резултата от целта дотогава, докато резултат на изхода съвпадне с целта. В практиката се използват  множество входни- изходни сигнали, наблюдава  се интензивен процес на контрол и учене като това позволява тренинг на мрежата.

Експертите препоръчват няколко стратегии за обучение на невронната мрежа:

· контролирано обучение-например при разпознаване на лица, мрежата се опитва да отгатне какво е изобразено, докато инструкторът я снабдява с точни отговори;

· неконтролируемо обучение-при набор от данни с неясни отговори, като един от подходите тук е създаване на кластъри от данни и елементи, подредени в групи, съобразени с неясните параметри;

· усъвършенствано учене или това е стратегия базирана на наблюдение; този тип обучение е типично за роботиката.

Невронните мрежи, според публикации [6] на университета в Станфорд могат да се използват за следните дейности:

§ предсказване – невронната мрежа може да се тренира да осигурява резултати, които произтичат от специфични входни данни; ако разполагаме с подходяща мрежа, която може да моделира известни последствия от стойности или значения, то тогава може да  бъде използвана за предсказване на бъдещи резултати, най-вероятно приложение намира за прогнозиране на пазарни тенденции;

§  формиране на клъстери: когато се анализират данни, които са прекалено сложни и не могат да бъдат класифицирани в отделни категории, тогава се използват невронните мрежи, с цел идентифициране на специфични черти  на данните и след това класифициране в отделни категории, без наличие на предварително знание за данните. Тази техника е полезна при извличане на данни, необходими както за търговски, така и за научни цели;

§ създаване на асоциации: невронната мрежа може да бъде тренирана да запомня  поредица от смислови значения, така че, когато се представи изкривена версия на даден модел, мрежата прави асоциация с най-близката подобна структура, закодиран в паметта и, като след това възстановява оригиналната версия на модела. Този подход се използва за възстановяване на данни, които са били обект на различни шумове или са непълни.

Невронните мрежи [7] в близко бъдеще ще се ориентират в следните направления:

o   осигуряване на възможност на роботизираните системи да виждат, усещат и  предсказват поведението на реалните неща около тях;

o   подобряване условията за анализ на потенциални пазарни тенденции;

o   усъвършенстване на самоуправляващите автомобили, които ще станат ежедневна практика;

o   композиране на музикални произведения;

o   трансформиране на документи, изготвяни на ръка във форматирани файлове,  подлежащи на компютърна обработка и редактиране;

o   регистриране на  тенденции при модификация на човешките гени;

o   автоматизирано диагностициране  на различни болести.

В невронната мрежа всеки неврон, може да получава стимули от други неврони. Обработката на информация се реализира на изхода при всеки неврон. Невронните мрежи притежават развита способност за обучение,  така че да представят поведението на всеки един проблем. След обучението невронната мрежа може да преценя отделни връзки, кодиращи информация,  свързана с определен проблем, в случая   се разчита на поредица от не интерпретирани данни.

Интелигентната невронна [8], компютърна мрежа (ANN) е модел за обработка на  информация, вдъхновена от биологични нервни системи, от типа на мозъка. Ключов елемент на модела е иновативна структура на система за обработка на информация. Мрежата е изградена от голямо количество взаимосвързани елементи (неврони), работещи в синхрон, с цел решаване на специфични проблеми. ANN подобно на хората се самообучава с помощта на примери и се конфигурира както за специфично приложение в практиката, така и за изпълнение на задачи от типа на класификация или разпознаване на данни. Ученето в биологичните системи включва настройване на синаптичните връзки между отделните неврони. Известни учени, които изследват възможностите на подобни мрежи през 70-те години са Мински и Пейпърт. През 1943 г. невро-физиологът Уорън МакКълок и Уолтър Питс публикуват статия, относно процесите, свързани с невроните. За да опишат как работят невроните в човешкия мозък, те подготвят и създават опростен модел на невронна мрежа като използват електрическа верига. През 50-те години компютрите се усъвършенстват и това позволява да се симулира работата на хипотетична невронна мрежа. Първи стъпки в тази посока са направени от Натанаил Рочестър, работещ в лабораторията на Ай Бием. За съжаление този първи опит е неуспешен. По-късно през 1959 г. Бърнард Уидроу и Марсиан Хоф от Станфорд разработват модели, наречени "Adaline" и "Madaline”. Последният проект по същество е първата невронна мрежа, приложена за решаване на реален проблем, използва се адаптивен филтър, който елиминира ехо-сигналите в телефонна линия. Невронните мрежи имат свойството да извличат значение от комплицирани и неточни данни, използват се разработване на модели, отчитащи тенденции. Предимствата им се заключават в адаптивно учене; самоорганизация на процесите; извършване на операции в реално време; избягване на грешки, с помощта на кодиране на информацията, базирана на редундантност.

В последните години възникна и друго понятие като  "дълбочинно учене" (Deep learning) или това е разновидност на машинното обучение и е свързано основно с  процесите по разпознаване на реч, текстове и образи. Базира се на невронни мрежи, позволява на компютрите да се учат при решаване на определени задачи, да организират информацията и създават образци на поведения. DL комбинира напредъка в компютърните технологии с развитието на невронните мрежи, с цел изучаване на комплицирани структури в големи обеми от данни. Техниките в тази сфера се използват основно за идентифициране  на обекти, закодирани в снимки и думи в звуци. Намира още приложение за автоматични преводи на текстове от различни езици,  поставяне на медицински диагнози и решаване на социални и бизнес проблеми. От медийна гледна точка тази технология ще намери изключително приложение при контент анализа на определени блокове и структури медийно съдържание, за да се идентифицират впоследствие с  по-голяма точност медийните ефекти сред читателите.

Невронните мрежи са базирани на поредица от алгоритми, имитиращи действието на човешкия мозък, с основна цел да разпознават различни  модели и структури. Те интерпретират данни от външни сензори, с помощта на техниката, известна като  "машинна перцепция", тоест могат да структурират, подреждат  и дават имена на данните, получавани на входа на системата. Моделите, които разпознават са цифрови и съдържат вектори, с помощта на които, могат да се дефинират реални данни, независимо дали са снимки, звуци, текстове или времеви отрязъци. Невронните мрежи подпомагат хората да класифицират и подреждат определени обекти. Това става в основния най-горен слой на мрежата, където се  съхраняват и управляват данните. В състояние са  да формират групи от неясно дефинирани данни, като използват сходства и примери от практиката, с други думи мрежата се подлага на тренинг и обучение. По-точно казано  мрежите предлагат характеристики на обекти, които служат като база на други алгоритми за класификация на елементи от света и формиране на клъстери. Възможно е  дълбочинните мрежи [9] да се разглеждат като компонент на по-разширено приложение на технологията  "машинно учене", като се вмъкват специални алгоритми, които усилват процеса по обучение, класификация и връщане назад в миналото. От медийна и информационна гледна точка най-важната функция на тези мрежи е да се използват за целите на прогностичен анализ. На практика това е свързано с класификация на реални обекти, намиране на корелации, например между снимки и имена на хора, свързани с тях.  Дълбочинното учене може да установи и връзки между текущи неща и бъдещи събития. По дефиниция времето в случая се игнорира, т. е., дълбочинната мрежа можа да разчита поредица от факти и цифри и предсказва какво би станало с тях в един следващ момент или етап на развитие. Дълбочинното учене е мощен инструмент от техники за придобиване на знание, използвано в невронната мрежа. Може да се твърди, че двете технологии (невронна мрежа и дълбочинно учене)  осигуряват най-добрите решения при  множество проблеми, от типа на разпознаване на образи, реч и естествен език.

В последните няколко години се наблюдава бум на публикациите в медии, сайтове и специализирани списания за ролята и значението на изкуствения интелект в бизнеса и институциите. Прогнозите за развитие на технологията са повече от оптимистични, макар че реалните постижения не са толкова забележими.  Може да се каже, че са налице повече проблеми, отколкото значими успехи. Голяма част от публикациите и прогнозите за развитие имат рекламна и маркетингова цел, като обслужват интересите на големите технологични компании. По-нататък ще направим един преглед на понятието AI (Artificial Intelligence) и постиженията, свързани с изкуствен интелект. Според дефинициите, предложени в техническата енциклопедия (www.techopedia.com) изкуственият интелект е област от науката за компютри, която е ориентирана към създаване на интелигентни машини, които работят и реагират подобно на човека. Някои от елементите на компютрите с изкуствен интелект включват следните основни дейности: разпознаване на реч, самообучение, планиране и решаване на  проблеми. Изследванията, свързани с изкуствен интелект са високо технологични и специализирани. Основният проблем в случая, се заключва в това, по какъв начин да се програмират компютрите, за да притежават знание; логика; да идентифицират проблеми; способности за планиране; перцепция; да притежават качества за манипулиране и придвижване на  обекти. Инженерство на знанието е важна част от AI  изследванията. Машините трябва да могат да  действат и реагират подобно на хората, при условие, че  притежават достатъчна информация за света. Изкуственият интелект трябва да има достъп до обекти, категории, качества и съответните отношения между тези важни елементи, и да са в състояние да проектират нещата. Машинното обучение е другата важна част от  AI. Обучението, без  външен контрол още изисква способности да се идентифицират модели, в зависимост  постъпващата информация на входа на системата. От друга страна, машинната перцепция е свързана със способности да се използват данни от сензори, интегрирани във външната среда, компютърната визия означава възможности за анализ на визуални сигнали.

Според дефинициите в известния сайт за професионалисти "течтаргет" невронната мрежа представлява система от хардуерни и софтуерни елементи които имитират дейността на невроните в мозъка. Тези мрежи се наричат още "интелигентни невронни мрежи" и са разновидност на технологията "дълбочинно учене".  Мрежите се състоят от огромно количество процесори, които  работят паралелно и са подредени под формата на отделни разположени по вертикалата редове. Всеки следващ ред допълва обработката на данни, направени в  предишната позиция. Невронните мрежи са конструирани така, че да бъдат адаптивни, което означава че могат да модифицират поведението си  в зависимост от наученото по време на тренинга и са в състояние да осигурят максимално количество информация за  заобикалящата ни среда.  Обучението се провежда както се осигуряват данни на входа и се обяснява на мрежата какъв да бъде крайния резултат. Например, за да се изгради мрежа, която да идентифицира лицето на актьори, началният тренинг започва със серия от снимки на "актьори", "не-актьори", "маски", "скулптури", лица на животни и други. Осигуряват се определени отговори и модели, с помощта на които личността да бъде идентифицирана веднага.

В списанието "Американска наука" [10] в една от публикациите в последната година се търси отговор на въпроса "Каква е ролята на невронните мрежи и доколко се различават от дигиталните компютърни системи". За авторите от списанието интелигентните, невронни мрежи са жизнено важен модел за решаване на различни проблеми, включително класификация на обекти, синтез и разпознаване на реч, изграждане на адаптивни интерфейси между човека и комплексните физически системи, компресия на снимки и образи, прогнози и предсказване на тенденции и моделиране на нелинеарни системи. Ключова черта на мрежата е вътрешната паралелна архитектура, която позволява по-бърза обработка на данни и вземане на решения,  като в случая се разчита на работата на  паралелни, дигитални устройства и адаптивен хардуер. В повечето случаи невронната мрежа съществува под формата на програми, които се изпълняват на персонални или работни компютърни станции. Тези мрежи се наричат "невронни", в смисъл, че са вдъхновени от работата на мозъка и невро-науките, но не е задължително да се търси някаква връзка в тази посока. По-скоро представляват правдоподобни модели на биологични, нервни и когнитивни феномени.

Невронните мрежи са в състояние да се самообучават и учат от опита. Те са още мощни инструменти за решаване на проблеми, особено тези, където традиционните, формални анализи трудно работят. Предимството на тези мрежи са при анализ на комплексни, нелинеарни данни. Невронните мрежи предлагат ефективни решения на проблемни области, свързани с класификация, прогнозиране, филтриране, разпознаване на образци и модели на поведение. Факт е, че много от мрежите са по-близки до традиционните математически или статистически модели от типа на кластърни алгоритми, нелинеарни филтри, класификатори на непараметрични структури, статистически регресивни модели. От тази гледна точка е трудно да се твърди, че имитират поведението  на  невро-биологични системи. По-долу са посочени някои данни за популярността на проблематиката w големите медии и сайтове. Например, в мрежата на Ройтерс в последните 2 години има 22 публикации по темата. В сайта на "Ню Йорк Таймс" в последните 12 месеца (2016 – 2017) има 15 резултата, свързани с невронни мрежи. На уеб страницата на БиБиСи могат да се открият около 10 новини, свързани с технологията. В електронното списание "Информационен мениджмънт" публикациите по темата са повече от 7000, това е специализирано издание и интереса към тази технология и изключително голям. През 2012 г. Гугъл разработва невронна мрежа, изградена от 16 000 компютри като я нарича  Google brain, използва специален алгоритъм, разработен в Станфорд, базиран на теориите как човешкият мозък се учи и обучава. Ще се спра на друг актуален пример, когато програмата на "Гугъл", наречена "АлфаГО", разгроми за втори път през  2017 г. световния шампион на играта "Го". През март, 2016 г.  AlphaGo постига историческа победа като побеждава световния шампион за тази година Лий Седол в турнир от пет игри. За целите на играта се използват 12-слойни невронни мрежи. През месец май, 2017 г. побеждава отново световният шампион Ке Джи на "го" като турнирът се провежда в Китай. По-късно Ке казва, че по средата на играта бил много близко до победа, но допуснал няколко грешки като добавя още, че последната версия на  AlphaGo е на 100% перфектна и смята, че разбирането на човека за тази игра  е ограничено. Играта "Go" е създадена в Китай преди 3000 години, това още е стратегическа и комплексна игра с много повече комбинации от шаха, играе се от двама играчи, на дъска с възможни позиции 19x19 или 13x13. При тази игра няма фиксирани движения, така че можем да се движим във всички възможни посоки. Целта на играта е да се контролира  колкото се може по-голяма територия на игралното поле, в сравнение с опонента. Другата задача тук е да се създаде нещо, отколкото да се разруши, както е при шаха. Концепцията за баланс е основна в играта. Учените са установили, че при тази игра човек използва едновременно и двете полусфери на мозъка си, тоест налице е комбинация между креативно и логическо мислене. За победа в играта се изисква развита интуиция, чувства, интелектуална дълбочина и човешко въображение. Wсички тези характеристики са усъвършенствани от човека  в продължение на векове.

При традиционните методи на "изкуствения интелект", които са конструирани да търсят решения под формата на разклонения ("дърво") във всички възможни позиции като се следва някаква машинна логика, нямат голям шанс за победа в тази игра. Изисква се нов подход, който предлага и "Гугъл" в проекта си AlphaGo [11], където се комбинират търсене на решения под формата на "дърво" (класически метод във сферата на AI) и "дълбочинни невронни мрежи". Тези мрежи включват цялото описание на играта под формата на входни данни и процеси, с помощта на разположени на различни равнища слоеве от мрежи, съдържащи милиони връзки, имитиращи работата на "невроните". Една от мрежите отговаря за "политиката" на поведение и избира следващия ход в играта. Друга мрежа, наречена "ценностна мрежа" предсказва кой ще бъде победителят в играта. AlphaGo в началото се тренира като и се показват поредица от аматьорски игри, за да  се помогне на мрежата да разбере същността на играта и усвои собствен модел за поведение, приличащ на модела за реакция на човека. След това се задават различни версии на играта и се проиграват хиляди пъти от системата, всеки път невронната мрежа се учи от собствените си грешки и увеличава способностите си за по-добра игра, докато се превърне в изключително силен играч, като това се постига  с  метод наречен "усилено обучение". AlphaGo е първата компютърна програма, разгромила световния шампион в тази сфера и се  превръща в най-силния играч в историята на играта. Въвеждат се и нови алгоритми за търсене, които комбинират възможностите на  известната програма за симулиране на реалности "Монте Карло" със способностите на мрежите, дефиниращи "политиката" и "ценностите". След продължително обучение на   AlphaGo се достига процент  на успеваемост 99,8% при игра срещу други програми, след това невронната мрежа пет последователни пъти побеждава европейския шампион по Go.

За разлика от Гугъл, компанията Ай-Би-Ем развива когнитивни аналитични системи [12], които позволяват на хоратада търсят решения и генерират идеи като използват колективно знание в мрежата. Целта в случая е да се развие функционална  интелектуална, компютърна способност, доближаваща се до начина на мислене на човека. В определен период от време компютрите ще бъдат в състояние да изземат всички изпълнявани от хората задачи, включително разсъждение, творчество и самоконтрол. Подобни машини ще ни направят почти излишни. Това не е само визия на писатели на научно-фантастична литература, но и виждане на такива личности като Стивън Хокинг и Бил Гейтс. Други учени твърдят точно обратното, че творчеството е типично само за човека и ще бъде недостъпно за компютрите.

Какви са постиженията на когнитивните компютърни системи до момента.

§ Организиране на съдържание – събиране и търсене на връзки между отделни данни, изследване и анализ информационни ресурси.

§ Машинно учене – в състояние сме да обучим компютрите да използват домейна на знание. Може да се научи компютъра да преценява, кои от отговорите при анализа на данни са коректни и кои са неправилни. Процесът прилича на  обучението на ученици от учител.

§ Оценка на резултати – когнитивните компютри подсказват решения и предлагат отговори. Но тези отговори са базирани на корпуса от знание, които хората са въвели в паметта на системата. Компютрите не могат да намерят нещо ново като решение, а  само да маркират отговори, които са загатнати някъде в текста.

§ Интелигентните машини се представят най-добре при  партньорство с човека, отколкото изцяло да го заменят в работата,  компютърът може да взема автоматично само някои от решенията. Опитът с безпилотни автономни средства показва, че при извънредна ситуация или опасност човека може да поеме управлението от автомобила.

§ Въздействие на интелигентните компютърни системи може  на практика да намали разходите в производството, да подобри качеството и продуктивността като се използват приоритетно смарт подходи за автоматизиране на някои от задачите, които изпълнява човека.

Възможно е някой ден изкуственият интелект и в частност когнитивните компютри да се доближат до човека в творческия процес, но това ще се реализира в далечно бъдеще. Според официалните твърдения на IBM когнитивните компютри са в състояние да разкрият потенциала, заложен във всички данни- вътрешни, външни, структурирани и неструктурирани, гласови и визуални и да  ги ориентират към обща синхронизирана работа. От тази гледна точка фирмите могат да вземат по-ефективни оперативни решения, да разберат  по-добре желанията и потребностите на консуматора, да  общуват в реално време, да оптимизират бизнес процесите, като се разчита на когнитивните способности за разбиране и учене.

Най-успешния  продукт на IBM в когнитивните системи е  проекта "Watson" [13]. Някои от възможностите на платформата са следните:

· дизайн на  "чатботове", които разбират човешката реч, могат да влизат в разговори и се разполагат в платформи за съобщения, уебсайтове и други устройства;

· изследване и откриване – да се осигури ефективно търсене на ресурси и аналитични инструменти за анализ на съдържание; да се използва опростен език за изследване на данни, бързо откриване на  новини като всеки ден се добавят в системата до 300 000 новинарски статии от 100 000 източника;

· платформата се използва за управление на ресурси, с помощта на естествен език, без да е необходимо човек да бъде експерт в науката за данни или машинно обучение;

· разпознаване на образи и цветове, като при отговора към всяка снимка  се добавя кратка характеристика и класификация, тоест веднага се назовава наименованието на цвета и факти за него. Последните приложения са в областта на модния дизайн, например австралийският дизайнер Джейсън Греч използва Watson Visual Recognition за анализиране и предсказване на тенденциите в цветовете в модната индустрия.

Примери за когнитивни компютърни системи: IBM Watson; Microsoft cognitive services; Cisko cognitive treats analytics; Google deeep mind; Customer Matrix cognitive engine; SparkCognition. Известно е, че когнитивните компютърни системи могат да анализират данни от порядъка на  стотици "гигабайта" да разпознават рискове, които по-рано са били игнорирани, поради липса на достатъчни аналитични инструменти и платформи. Когнитивните компютри са в състояние още да обработват информация в реално време,  от сензорни мрежи, локални метео-станции, видео камери (разположени на земята, морето, въздушното пространство и сателити), с цел по-точни прогнози на времето, както и ефективно използване на енергийни ресурси. Позволяват на производствените компании да следят за висококачествена продукция на  изхода, така и да изграждат  хомогенни мрежи за доставка на стоки и ресурси за производство.

Друг пример е с компанията „Амазон“, която се превръща не само в най-голямата фирма, но и в една от най-иновативната в света като мениджърите там също разчитат на интелигентни и аналитични инструменти. В последната година разработиха и предложиха на пазара смарт платформата Amazon Echo. Някои от възможностите и са следните:

o   слушане на музика от Amazon Music, Spotify, Pandora, iHeartRadio, TuneIn, управлението става с гласови команди;

o   с помощта на сайта "Алекса" се изпращат съобщения или текст до приятели и семейство;

o   създаване на имерсивна аудио среда в стаята, където е инсталирана аудио-колоната;

o   отговор на въпроси, съобщаване на новини, информация за пътната обстановка в района и прогнози за времето, четене на аудио книги от  Audible, съобщаване на новости за локалния бизнес, обявяване резултати от спортни състезания;

o   контрол на осветление, термостати, гаражни врати, ключалки, и всички устройства разположение в дома ви с марките на WeMo, Philips Hue, Samsung SmartThings, Nest;

o   добавяне на нови функции като развиване на умения за игри, контакти с  услугата Uber.

Някои от характеристики са следните: разпознаване на глас, синхронизиране на контрола в  смарт къщи и жилища. Предлагат се и безплатни мобилни приложения за управление на „Еко“- Fire OS, Android, iOS, различни приставки към браузъри. Технологията, която се използва за целите на системата Еко е базирана на  машинно обучение, смарт елементи,  облачни ресурси, NLP алгоритми (управление на процеси и команди на естествен език). Информацията се извлича с помощта на техниката "knowldge representation. Използват се облачните ресурси на Амазон, които се управляват от  интелигентни агенти (IA) като в случая отново се разчита на машинно учене. Може да се твърди, че не може да съществува изкуствен интелект, без интелигентни средства или израза тук е "No AI without IA". Продуктите на Амазон с успех могат да се използват както за образование, тренинг и развлечение, така и за целите на съвременните медии. При добро въображение може да се оборудва и радио студио за обучение на конкуренти цени или в рамките на около 1000 лв.

Подобна технология е разработена от компанията „Епъл“, наречена Apple Homepod [14]. Новата тонколона на Епъл комбинира инженерните и аудио-технологии на компанията, с иновативен софтуер като осигурява високо качество на звука в стаята. Използва се специален алгоритъм за анализ на музиката и динамичните тонове, създава се имерсивна музикална среда, с 360º аудио. Това още е смарт устройство, управлявано с глас може да споделяте, какво обичате да слушате като колоната отговаря автоматически на  вашето желание. HomePod анализира акустиката в стаята, настройва звуците в зависимост от разположението и. Създадена е така, че да осигурява най-доброто от  Apple Music. С помощта на интелигентността на Siri имаме виртуален достъп до всички записи, свързани с дадено направление в  музиката, работи още като музикален експерт и осигурява достъп до тази песен, която желаем да чуем в момента. Устройството се управлява и с допир, докосвания. Това е само една от многото функции, заложени в интелигентната система, отговаря на въпроси, свързани с ежедневната дейност. Представлява и хъб за контрол на всички смарт аксесоари в дома – от обикновената лампа – до цялата къща, като това става с гласови команди. Голяма част от устройствата в къщи работят при помощта на платформата. HomeKit - климатици, гаражни врати и камери за сигурност, добавя се аксесоара към мобилното приложение на Home и след това се контролира с умната колона. HomePod се тренира да разпознава и отговаря на въпроси от категориите на: мерки, часове, таймери, преводи, новини, спорт, време, трафик и общо знание за нещата в дома. Примери за потенциални въпроси:

"Hey Siri, give me the news";"Hey Siri,  turn off the lights". Работни езици – само на английски (Australia, UK, U.S).

За да стане по-ясно, какви са възможностите и практическо приложение на невронните мрежи ще дам един пример, базиран на опита на  американския софтуерен инженер  Зак Тоут [15] създал специална мрежа, която се самообучава, за да допише  шестия роман от популярната сага "Игра на тронове", с автор Джордж Р.Р. Мартин.  Предварително записал в мрежата петте публикувани вече романа, за да може самообучаващата се интелигентна система да получи данни за персонажите и стила на автора. След това започва да тренира невронната мрежа, за да запомни детайли от  сюжета като се анализират няколко хиляди думи. На теория дългосрочната  памет на системата трябва да предотврати повторение на вече случили се сцени и епизоди и на изхода да се получи истинска нова версия на книгата, а не обикновен алтернативен текст. Мрежата още трябва да помни какво е станало с героите и да не пише вече за тези, които сa умрели или загинали.Тоут демонстрира работата на невронна мрежа, в която са интегрирани повече от няколко хиляди страници от  първите книги на сагата и успял да напише  пет нови глави със сцени, които могат да се случат във легендарната страна. Всяка нова глава започва с името на персонажа и количеството думи, които трябва да присъстват в текста. В резултат системата е в състояние да състави напълно четима версия на книгата, с определени и неочаквани сюжетни линии. В случая, невронните мрежи  използват специални класове алгоритми от технологията "машинно обучение", моделират ги съгласно принципите на невронните връзки в мозъка, създават се подкласове и се работи с последователни част от данни, под формата на текстове. За да се тренира успешно модела, е необходимо да се знае предварително от обучаемия, какъв да бъде идеалният резултат или крайните цели.

Невронната мрежа сравнява данните на входа и изхода, съобразно въведените цели, променливи и желани ценности, като се адаптира към изискванията на дизайнера на мрежата, така че да се получи най-добър резултат. В мрежата има интегриран модел на дългосрочна памет, за да се запомнят неща, които са се случвали в миналото. За отбелязване, че мрежата допуска и грешки, които могат да се избегнат с достатъчно обучение. Реално са добавени в паметта на мрежата 5376 страници, написани са пет глави от книгата и публикувани от Тоут в професионалния сайт за проекти github. Тоут посочва още, че в романа има 32 000 уникални думи, и това създава трудности при тренинг на мрежата. За отбелязване е, че подобен тип мрежа, наречена още RNN, текста от пет романа  е прекалено малък отрязък от данни за да се обучи пълноценно мрежата и получи перфектен краен резултат. Идеалният вариант ще бъде, ако книгата се състои от 100 тома. Следващият проект на автора е да добави и сцени от ТВ сериите и филма, базиран на книгата. Можем да се представим генериране на един журналистически текст с помощта на невронна мрежа, особено по комплицирани международни проблеми, където съществуват достатъчно на брой данни и вече проведени анализи по света, веднага възниква въпроса за какъв срок може да бъде подготвен от мрежа и какво ще бъде нивото на качество на анализа, и съдържанието при сравнение със скромните възможности на един съвременен журналист. От тази гледна точка постиженията в областта на невронните мрежи, създават заплахи за онези професии, които са ориентирани към работа с данни, факти и информация.

Изводи: В съвременното общество компетенциите на бизнес лидерите зависят от уменията и знанията им интелигентно да използват в практиката всички достъпни технологии, като по този начин усъвършенстват и развиват своите идеи и добавят допълнителни ценности към подходите за обработка на информация и вземане на решения. Ново възникващите като GRIN технологии са директно ориентирани към изграждане на един по-интелигентен свят. В основата им стоят революционното развитие на някои аспекти от човешкото знание, свързани с формиране на роботизирани места и обекти, генетично инженерство, засилване ролята на информацията за развитие на обществото и бизнеса, и  нано-технологиите. В тази посока се развиха такива направление в бизнеса, както икономика базирана и ръководена от данни, така и динамични алгоритми, интегрирани в обектите на производство. Това води от друга страна до развитие  на направлението "машинно учене" в по-съвършената му форма, известна като "адаптивно обучение" и постепенно интегриране на знанията от двете области в сферата на невронните мрежи. Всички тези иновации са както предизвикателство пред лидерите в съвременните общества, така и за прогнози, които да отчитат въздействието им върху хората, работните места, природата и икономиката.

 

Бележки:


[1] Тенденции за развитие на интелигентните устройства до 2020, институт "Гартнер'. Gartner tendency 2017

http://www.gartner.com/smarterwithgartner/gartners-top-10-technology-trends-2017. 20.07.2017

[2] Wiener, Norbert. Cybernetics or control and communication

in the animal and the machine. Second edition. The MIT press. Cambridge, Massachusetts.pp.117-118.

[3] Вж. Definitions of Cybernetics. American society for Cybernetics

https://www2.gwu.edu/~asc/cyber_definition.html 20.08.2017.

[4] Explained: Neural networks

Ballyhooed artificial-intelligence technique known as “deep learning.

Larry Hardesty, MIT News Office, April 14, 2017

http://news.mit.edu/2017/explained-neural-networks-deep-learning-0414. 21.08.2017

[5] Neural Network Toolbox User’s Guide. For Use with MATLAB.

Howard Demuth, Mark Beale. Version 4, online from 2002.

The MathWorks, Inc.www.mathworks.com Web comp. soft-sys. matlab

[6] Neural Networks. Stanford university.

https://cs.stanford.edu/people/eroberts/courses/soco/projects/neural-networks/

Architecture/usage.html. 22.08.2017

[7]  Вж. по- подробно. To Neural Networks and Beyond!

https://cs.stanford.edu/people/eroberts/courses/soco/projects/neural-networks/Future/index.html) 22.08.2027

[8]  Какво е невронна мрежа?

What is a Neural Network?

https://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html 20.07.2017

[9] Neural Network Definition

https://deeplearning4j.org/neuralnet-overview

http://neuralnetworksanddeeplearning.com)15.07.2017

[10] Вж. What is a neural network and how does its operation differ from

that of a digital computer?

https://www.scientificamerican.com/article/experts-neural-networks-like-brain/ 20.08.2017

[11] The story of AlphaGo so far

https://deepmind.com/research/alphago/; https://storage.googleapis.com/deepmindmedia/alphago/AlphaGoNaturePaper.pdf.22.08.2017

[12] More in Cognitive computing Analytics Business intelligence.

Opinion How creative will cognitive computing become? By Reinoud Kaasschieter. Published April 13 2017

https://www.information-management.com/opinion/how-creative-will-cognitive-computing-become 30.09.2017

[13] https://www.ibm.com/watson/developercloud/?lnk=mpr_buwa&lnk2=learn 22.08.2017

[14]  Вж. Програмата на Епъл „HomePod“ https://www.apple.com/homepod/)

[15]  Вж. източник:. Zack Thoutt. Интервю публикувано в сайта "motherboard"

на 28.08.2017г. http://bit.ly/2wGFmgS 30.09.2017

 

 

обратно нагоре