Un tur al modelelor de învățare profundă

Conţinut

Stil neuronal
Neural Storyteller
Date
Char-RNN TED
Concluzie

Sursa: Kran77 / Dreamstime.com

La pachet:

Modelele de învățare profundă învață computerele să gândească singure, cu rezultate foarte distractive și interesante.

Învățarea profundă se aplică tot mai multor domenii și industrii. De la mașini fără șofer, până la jocul Go, până la generarea de imagini muzicale, există noi modele de învățare profundă care apar zilnic. Aici trecem peste mai multe modele populare de învățare profundă. Oamenii de știință și dezvoltatorii iau aceste modele și le modifică în moduri noi și creative. Sperăm că această vitrină vă poate inspira să vedeți ce este posibil. (Pentru a afla mai multe progrese în inteligența artificială, consultați Va fi calculatorul va fi capabil să imite creierul uman?)

Stil neuronal

Nu îți poți îmbunătăți abilitățile de programare atunci când nimeni nu îi pasă de calitatea software-ului.

Neural Storyteller

Neural Storyteller este un model care, atunci când este dată o imagine, poate genera o poveste romantică despre imagine. Este o jucărie distractivă și totuși îți poți imagina viitorul și vezi direcția în care se mișcă toate aceste modele de inteligență artificială.

Funcția de mai sus este operația de „schimbare a stilului” care permite modelului să transfere legendele standard de imagine în stilul poveștilor din romane. Schimbarea stilului a fost inspirată de „Un algoritm neural al stilului artistic”.

Date

Există două surse principale de date care sunt utilizate în acest model. MSCOCO este un set de date de la Microsoft care conține aproximativ 300.000 de imagini, fiecare imagine conținând cinci subtitluri. MSCOCO este singura informație supravegheată folosită, ceea ce înseamnă că este singura dată în care oamenii au trebuit să intre și să scrie în mod explicit subtitrări pentru fiecare imagine.

Una dintre limitările majore ale unei rețele neuronale feed-forward este aceea că nu are memorie. Fiecare predicție este independentă de calculele anterioare, ca și cum ar fi prima și singura predicție realizată vreodată de rețea. Dar pentru multe sarcini, cum ar fi traducerea unei propoziții sau a unui paragraf, intrările ar trebui să constea din date secvențiale și legate în mod conual. De exemplu, ar fi dificil să se înțeleagă un singur cuvânt într-o propoziție fără conținutul oferit de cuvintele din jur.

RNN-urile sunt diferite, deoarece adaugă un alt set de conexiuni între neuroni. Aceste legături permit activarea neuronilor dintr-un strat ascuns pentru a se retrage în ei înșiși la pasul următor al secvenței. Cu alte cuvinte, la fiecare pas, un strat ascuns primește atât activarea de la stratul de sub el, cât și de la pasul anterior din secvență. Această structură oferă, în esență, memorie rețelelor neuronale recurente. Deci pentru sarcina de detectare a obiectelor, un RNN se poate baza pe clasificările sale anterioare de câini pentru a ajuta la determinarea dacă imaginea curentă este un câine.

Char-RNN TED

Această structură flexibilă în stratul ascuns permite RNN-urilor să fie foarte bune pentru modelele de limbaj la nivel de caracter. Char RNN, creat inițial de Andrej Karpathy, este un model care ia un fișier ca intrare și antrenează un RNN pentru a învăța să prezice următorul personaj într-o secvență. RNN poate genera caracter după caracter care va arăta ca datele de instruire originale. O demo a fost instruită folosind transcrieri ale diferitelor discuții TED. Introduceți modelul cu unul sau mai multe cuvinte cheie și va genera un pasaj despre cuvintele cheie (cuvintele cheie) în voce / stilul unei discuții TED.

Concluzie

Aceste modele prezintă noi descoperiri în inteligența mașinii care a devenit posibil din cauza învățării profunde. Învățarea profundă arată că putem rezolva probleme pe care nu le-am mai putea rezolva niciodată și nu am ajuns încă la acel platou. Așteptați să vedeți multe alte lucruri interesante, cum ar fi mașinile fără șoferi în următorii doi ani, ca urmare a inovației profunde a învățării.