Differences

This shows you the differences between two versions of the page.

--- ai [2014/11/27 14:40] – IDSIA eingefügt beckmanf
+++ ai [2025/12/13 15:15] (current) – add reinforcement learning papers for breakout beckmanf
@@ Line 1: / Line 1: @@
 ===== Artificial Intelligence =====
+==== Basics ====
 [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]]
@@ Line 12: / Line 13: @@
 Beschreibung "Deep Learning" am IDSIA (Schweizer Institut für AI). Die haben neun Wettbewerbe für Klassifikation gewonnen.
+[[http://image-net.org]]
+Wettbewerb für die Bilderkennung mit den Bereichen Klassifikation mit 1000 Klassen und Lokalisierung in einem Bild. Dabei stehen 1.2 Millionen Bilder für das Training zur Verfügung.
+==== Breakout / Deepmind / Reinforcement Learning ====
+Der [[breakout|GPU Rechner "breakout"]] hat seinen Namen anlässlich der Veröffentlichung von Deepmind bekommen, die zeigt, wie man mit Maschinenlernen (hier Reinforcement Learning) einen Computer das Spiel [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] spielen lassen kann. breakout wurde 1976 von Atari als Spielhallenautomatenspiel veröffentlicht. Der Entwickler des Spiels ist
+[[https://de.wikipedia.org/wiki/Steve_Wozniak|Steve Wozniak]]. Er hat [[https://db.hfsplay.fr/files/2019/06/14/4cfe7768-0c49-477b-b55f-61b6254fa435.pdf|45 TTL ICs]] benötigt. Hier ein [[https://youtu.be/BNqA7MTDUY8|Youtubevideo vom Breakoutspiel]].
+[[http://www.incompleteideas.net/book/RLbook2020.pdf|Richard S. Sutton and Andrew G. Barto, "Reinforcement Learning - An Introduction", Second Edition, online, 2020]]
+Das Standardeinführungsbuch für Reinforcement Learning.
+[[https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf|Volodymyr Mnih et al., "Human-level control through deep reinforcement learning", Nature, Vol. 518, 2015]], [[https://www.nature.com/articles/nature14236|Verlagsseite bei Nature]]
+Die Veröffentlichung von den Leuten von [[https://de.wikipedia.org/wiki/DeepMind|Deepmind]], die mit Reinforcement Learning gelernt haben Atari Spiele wie [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] oder Space Invaders zu spielen. Sensationell. In einem [[https://static-content.springer.com/esm/art%3A10.1038%2Fnature14236/MediaObjects/41586_2015_BFnature14236_MOESM124_ESM.mov|Video auf der Natureseite]] kann man sehen wie sich das Spielverhalten für breakout mit mehr gespielten Spielen immer weiter verbessert.