NLP DIY

Bardzo prosty framework for state-of-the-art NLP, stworzony przez Zalando Research to flair. Opis frameworka znajduje się tutaj. Różne typy sieci neuronowych zastosowane do obsługi NLP można znaleźć tutaj. Polski wkład do tej problematyki rozwija się dzięki polskiej odnodze sieci Clarin, która prezentuje projekty na własnej stronie GitHuba. Wśród nich znajduje się projekt pn. PolDeepNer, który rozpoznaje kategorie informacji w tekście, opierając się na deep learning.Polskie zasoby NLP znajdują się także tutaj.

Aktualizowany artykuł podsumowujący postęp rozwiązań na polu NLP przy użyciu deep learning znajduje się tutaj.

Niezły przegląd ostatnich technik NLP w Towards Data Science tutaj.

Ostatni sukces OpenAI: Better Language Models and Their Implications (luty 2019). Model języka pn. GPT-2 opisany w tym artykule jest uznawany za bardzo obiecujący, a nawet niebezpieczny. Komentarz do tego modelu znajduje się na stronie Towards Data Science. Detaliczny i prosty opis jego głównego składnika, którym jest tzw. Transformer architecture znajduje się tutaj.

Kurs na Uniwersytecie Stanforda: CS224n: Natural Language Processing with Deep Learning (mnóstwo materiałów 🙂 )

Bardzo dobry A Beginner’s Guide to Word2Vec and Neural Word Embeddings.

Inna koncepcja NLP, obejmująca analizę kontekstową tzw. deep contextualised word embeddings: ELMo model, w tekście “ELMo: Contextual language embedding” by Josh Taylor.

Aktualizacja 02.04.2019:
Na stronie mc.ai można znaleźć artykuły poświęcone podstawom neural networks i deep learning oraz ich implementacji w Pythonie – a must see – część I: Bread and Butter from Deep Learning by Andrew Ng — Course 1: Neural Networks and Deep Learning by Keon Yong Lee, 2.03.2019 oraz część II: The Bread and Butter from Deep Learning by Andrew Ng — Course 2: Improving Deep Neural Networks by Keon Yong Lee, 8.03.2019.
Pochodzą one z Medium, ale tam mogą być niedostępne.

 

 

Kay-fu Lee: Europa się nie liczy. Tym bardziej Polska

Nieoceniony O’Reilly przynosi hiobową opinię Kay-fu Lee, były szef w Apple I MIcrosoft,były wiceprezydent Google China, autor książki pt. AI Superpowers: China, Silicon Valley, and the New World Order (2018), który mówi wprost: Nie ma nadziei dla sektora sztucznej inteligencji w Europie.O’Reilly jako kontr opinię przedstawia raport Komisji Europejskiej z kwietnia 2018 roku. Pośród 20 omówionych w nim krajów brakuje Polski, mimo, że znajdują się tam takie państwa jak Rumunia czy Czechy. Słabym pocieszeniem jest brak Słowacji, Węgier czy Bułgarii.

AI na poważnie

Rozwój AI jest faktem o coraz szerszym znaczeniu. Kompetentne informacje na ten temat dostarcza nieoceniony O’Reilly. Wzbudza na przykład niepokoje na polu równowagi globalnej z powodu gwałtownego rozwoju AI w Chinach. Szczegółowy raport z roku 2018 na temat stanu badań i wdrożeń AI opracowała grupa badaczy z MIT, Uniwersytetu Stanforda, Harvarda i OpenAI, która utworzyła projekt pod nazwą Artificial Intelligence Index. Jest on częścią szerszej inicjatywy pn. One Hundred Year Study on Artificial Intelligence (AI100), któręj gospodarzem jest Uniwersytet Stanforda, a ściślej Stanford’s Human-Centered AI Institute (HAI). Ten Instytut deklaruje jako przedmiot swoich zainteresowań „To advance AI research, education, policy, and practice to benefit humanity”.

Dostępny jest także skrót raportu skrót na stronie MIT Technology Review zawierający najważniejsze wykresy.

DIY – Jeszcze o Keras i innych

Wiele podstawowych informacji nt. Keras mozna odnaleźć tutaj.  A zainteresowanych kursami dotyczącymi tej problematyki odsyłam nie tylko na Courserę ale także na fast.ai. Ważna strona dla zainteresowanych data science to ODSC (opendatascience).
Pomocne i darmowe narzędzie do projektowania graficznego sieci neuronowych to Deep Learning Studio produkcji Deep Cognition. W wersji desktopowej (lokalnej) jest darmowe, w wersji chmurowej pojawiają się opłaty za użycie mocy obliczeniowej. Jest dostępne dla Windows i Ubuntu. Innym takim narzędziem jest Neural Designer, dostępny dla Windows, Maca i Ubuntu. Wersja darmowa jest ograniczona liczbą linii kodu i dopuszczalną wydajnością procesora. Microsoft ma podobne narzędzie, jednak tylko w wersji webowej, pod nazwą Microsoft Azure Machine Learning Studio, które także ma wersję darmową, wymagającą konta Microsoft. Google udostępnia treningową i poglądową aplikację webową (playground tensorfow), pozwalająca projektować i obserwować w działaniu sieci neuronowe, działająca w oparciu o bibliotekę Tensorflow. Aplikacja Google ma charakter otwarty i jej kod jest dostępny na GitHub, co pozwala na własne modyfikacje włącznie z uruchomieniem lokalnym.

Ekspansja Chin na polu AI

Na konferencji pt. Artificial Intelligence Conference in San Francisco 2018 Kai-Fu Lee uzasadnił i opisał chińską ekspansję na polu sztucznej inteligencji wiodącą przez rozwój technologii cyfrowych w Chinach. Jak twierdzi mówca, przeszły one fazę naśladownictwa i znajdują się w fazie tworzenia własnych, oryginalnych i lepszych niż amerykańskie rozwiązań na tym polu. Kai-Fu Lee jest m.in. autorem książki pt. AI Superpowers: China, Silicon Valley, and the New World Order (1918). Relację dostarcza nieoceniony O’Reilly na YouTube:

Nowe prawo autorskie

12 września 2018 roku znaczącą większością głosów (438 do 226, przy 39 wstrzymujących się) Parlament Europejski uchwalił Dyrektywę w sprawie praw autorskich na jednolitym rynku cyfrowym (ostateczny, pełny tekst wniosku). Pierwotny kształt propozycji wzbudził wiele kontrowersji, ostateczną wersję komentuje kompetentnie Gazeta Prawna. Szczególne emocje wzbudzał Artykuł 13, wg niego treści maja być kontrolowane przez „dostawców usług społeczeństwa informacyjnego”. Gazeta prawna interpretuje to jako zobowiązanie autorów serwisów internetowych do „wprowadzenia mechanizmów filtrujących zamieszczone w nich treści”, a tym samym kontrolowania każdego materiału opublikowanego w Internecie. Uspokojony głos na temat nowych przepisów, wpisujący je w kontekst Polski podaje OKOPress. Informacje próbuje zebrać w całość Wikipedia. Tak czy inaczej kontrola treści w Internecie staje się faktem prawnym, choć do jego wdrożenia jeszcze daleka droga i konsultacje w poszczególnych państwach. Regulacja zwycięża jak zwykle.