Journal
Ce journal contient 4 entrées.
The Infinite Drum Machine
Une expérience de classification automatique sur des fichiers audio représentant des sons du quotidien. L'algorithme ne reçoit aucune information à priori (non supervisé) hormis les fichiers audio. La technique utilisée dans cette expérience est t-SNE (t-Distributed Stochastic Neighbor Embedding), permettant de réduire un espace à n dimensions vers un espace plus petit (ici 3 dimensions: X, Y, et couleur).
Description de t-SNE: http://jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf
Description de t-SNE: http://jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf
A curated list of awesome Machine Learning frameworks, libraries and software
Une liste de librairies d'apprentissage artificiel, de traitement du langage naturel et de data mining. Pour divers langages : C/C++, Java, Python, etc.
Mining of Massive Datasets
Un super bouquin sur le data mining, dont la couverture est certes moche, mais dont vous pouvez lire le contenu en ligne.
J'apprécie tout particulièrement son chapitre sur le stream processing, qui me concerne spécifiquement.
J'ai fait un backup du PDF du livre ici : http://benjaminbillet.fr/media/mining-of-massive-datasets.pdf
J'apprécie tout particulièrement son chapitre sur le stream processing, qui me concerne spécifiquement.
J'ai fait un backup du PDF du livre ici : http://benjaminbillet.fr/media/mining-of-massive-datasets.pdf
A Programmer's Guide to Data Mining
Un guide d'introduction au data mining, par la pratique. Au programme :
- Chapter 1: Introduction
- Chapter 2: Get Started with Recommendation Systems
- Chapter 3: Implicit ratings and item-based filtering
- Chapter 4: Classification
- Chapter 5: Further Explorations in Classification
- Chapter 6: Naïve Bayes
- Chapter 7: Naïve Bayes and unstructured text
- Chapter 8: Clustering
Le guide est toujours en cours de rédaction, à suivre donc.
- Chapter 1: Introduction
- Chapter 2: Get Started with Recommendation Systems
- Chapter 3: Implicit ratings and item-based filtering
- Chapter 4: Classification
- Chapter 5: Further Explorations in Classification
- Chapter 6: Naïve Bayes
- Chapter 7: Naïve Bayes and unstructured text
- Chapter 8: Clustering
Le guide est toujours en cours de rédaction, à suivre donc.
Ce journal est basé sur Ginger, un gestionnaire de lien minimaliste développé dans le cadre d'un stage de perfectionnement. Pour plus d'informations, consulter le wiki consacré à mes projets personnels.