NLP DIY

Bardzo prosty framework for state-of-the-art NLP, stworzony przez Zalando Research to flair. Opis frameworka znajduje się tutaj. Różne typy sieci neuronowych zastosowane do obsługi NLP można znaleźć tutaj. Polski wkład do tej problematyki rozwija się dzięki polskiej odnodze sieci Clarin, która prezentuje projekty na własnej stronie GitHuba. Wśród nich znajduje się projekt pn. PolDeepNer, który rozpoznaje kategorie informacji w tekście, opierając się na deep learning.Polskie zasoby NLP znajdują się także tutaj.

Aktualizowany artykuł podsumowujący postęp rozwiązań na polu NLP przy użyciu deep learning znajduje się tutaj.

Niezły przegląd ostatnich technik NLP w Towards Data Science tutaj.

Ostatni sukces OpenAI: Better Language Models and Their Implications (luty 2019). Model języka pn. GPT-2 opisany w tym artykule jest uznawany za bardzo obiecujący, a nawet niebezpieczny. Komentarz do tego modelu znajduje się na stronie Towards Data Science. Detaliczny i prosty opis jego głównego składnika, którym jest tzw. Transformer architecture znajduje się tutaj.

Kurs na Uniwersytecie Stanforda: CS224n: Natural Language Processing with Deep Learning (mnóstwo materiałów 🙂 )

Bardzo dobry A Beginner’s Guide to Word2Vec and Neural Word Embeddings.

Inna koncepcja NLP, obejmująca analizę kontekstową tzw. deep contextualised word embeddings: ELMo model, w tekście “ELMo: Contextual language embedding” by Josh Taylor.

Aktualizacja 02.04.2019:
Na stronie mc.ai można znaleźć artykuły poświęcone podstawom neural networks i deep learning oraz ich implementacji w Pythonie – a must see – część I: Bread and Butter from Deep Learning by Andrew Ng — Course 1: Neural Networks and Deep Learning by Keon Yong Lee, 2.03.2019 oraz część II: The Bread and Butter from Deep Learning by Andrew Ng — Course 2: Improving Deep Neural Networks by Keon Yong Lee, 8.03.2019.
Pochodzą one z Medium, ale tam mogą być niedostępne.

 

 

DIY – konwolucyjne sieci neuronowe w Keras

Poradnik, jak użyć frameworku Keras do tworzenia konwolucyjnych sieci neuronowych na szkolnym przykładzie rozpoznawania cyfr z bazy MNIST na stronie Towards Data Science, gdzie jest wiele materiałów poświęconych machine learning, data science itp. Keras jest nakładką na Tensorflow napisaną w Pythonie i znacznie ułatwia korzystanie z tego ostatniego. Stamtąd także pochodzi poradnik: How to build your own Neural Network from scratch in Python.
A jak ktoś szuka materiałów polskich to proszę zajrzeć na przykład do blogu About Data Krzysztofa Sopyły.

DIY: jak napisać rozmawiającego bota?

Na stronie GitHub można znaleźć obszerne i różnorodne materiały, pochodzące z kursu tworzenia własnego bota, potrafiącego prowadzić konwersacje online. Kurs jest fragmentem programu edukacyjnego pn. ITP przeznaczonego dla dorosłych i prowadzonego przez Tisch School of the Arts na New York University. W ramach tego programu są organizowane czterotygodniowe kursy pn. ITP Camp. W roku 2017 kurs taki został poświęcony botom i ich tworzeniu (więcej). Nawet bez udziału w kursie materiały te pozwalają rozpocząć przygodę z najnowszymi technologiami takimi jak AI bez specjalnej wiedzy dotyczącej programowania.