Random Forests
- [Breiman01] Leo
Breiman, Random forests, Machine Learning 45 (1) 5-32, 2001.
– Die
Haupt-Veröffentlichung zum Thema, zum Zitieren in wiss. Arbeiten,
allerdings recht mathematisch und für’s pragmatische Arbeiten etwas
weniger geeignet. http://oz.berkeley.edu/users/breiman/randomforest2001.pdf.
- [Breiman02] Leo Breiman, Manual On Setting
Up, Using, And Understanding Random Forests V3.1, http://oz.berkeley.edu/users/breiman/Using_random_forests_V3.1.pdf.
[Breiman02b] Leo Breiman, Manual On Setting Up, Using, And
Understanding Random Forests V4.0, http://oz.berkeley.edu/users/breiman/Using_random_forests_V4.0.pdf.
Manuals
zum Fortran-Code, aber auch lesenswert wg. Beschreibung wie RF arbeitet
und der Data-Mining-Beispiele. Das V3.1-Manual enthält ein paar mehr
Erklärung zur Variable-Importance, die in V4.0 leider fehlen. Dafür
enthält V4.0 neue Features zu Missing Values.
- [BreimanCutler] http://stat-www.berkeley.edu/users/breiman/RandomForests/cc_home.htm: Die
“description”-Seite auf dem “classification/clustering”-Teil der
Random-Forest-Page. Bringt eigentlich die beste Einführung zum Thema für den
Praktiker. Zum Teil Überlapp mit dem obigen Manual, z.T. aber auch eine
griffigere und umfassendere Darstellung der Konzepte.
- [Breiman03]
Leo Breiman, RF / tools – A Class
of Two-eyed Algorithms, Talk at SIAM Workshop, May 2003, http://www.cs.cmu.edu/~lafferty/ml-stat/breiman.pdf
- [UC-Berkeley05]
Nachruf auf Leo Breiman, der am 05.07.05 starb.
http://www.berkeley.edu/news/media/releases/2005/07/07_breiman.shtml
Software und Datensätze
Ein paar (kostenfreie)
Software-Angebote zu Data Mining. Es gibt eine fast unübersehbare Fülle von Data
Mining Tools, für einen umfassenden Überblick siehe http://www.kdnuggets.com (eine auch
ansonsten recht interessante Website für Neues aus dem Bereich Knowledge
Discovery & Data Mining)
R-Tutorials
Info zum WPF DMC
Themen im Detail
© Wolfgang Konen, Thomas
Bartz-Beielstein 09/2007 – 11/2009.