ai

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
ai [2014/11/27 14:40] – IDSIA eingefügt beckmanfai [2025/12/13 15:15] (current) – add reinforcement learning papers for breakout beckmanf
Line 1: Line 1:
 ===== Artificial Intelligence ===== ===== Artificial Intelligence =====
  
 +==== Basics ====
 [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]] [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]]
  
Line 12: Line 13:
  
 Beschreibung "Deep Learning" am IDSIA (Schweizer Institut für AI). Die haben neun Wettbewerbe für Klassifikation gewonnen.  Beschreibung "Deep Learning" am IDSIA (Schweizer Institut für AI). Die haben neun Wettbewerbe für Klassifikation gewonnen. 
 +
 +[[http://image-net.org]]
 +
 +Wettbewerb für die Bilderkennung mit den Bereichen Klassifikation mit 1000 Klassen und Lokalisierung in einem Bild. Dabei stehen 1.2 Millionen Bilder für das Training zur Verfügung.
 +
 +==== Breakout / Deepmind / Reinforcement Learning ====
 +
 +Der [[breakout|GPU Rechner "breakout"]] hat seinen Namen anlässlich der Veröffentlichung von Deepmind bekommen, die zeigt, wie man mit Maschinenlernen (hier Reinforcement Learning) einen Computer das Spiel [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] spielen lassen kann. breakout wurde 1976 von Atari als Spielhallenautomatenspiel veröffentlicht. Der Entwickler des Spiels ist 
 +[[https://de.wikipedia.org/wiki/Steve_Wozniak|Steve Wozniak]]. Er hat [[https://db.hfsplay.fr/files/2019/06/14/4cfe7768-0c49-477b-b55f-61b6254fa435.pdf|45 TTL ICs]] benötigt. Hier ein [[https://youtu.be/BNqA7MTDUY8|Youtubevideo vom Breakoutspiel]].
 +
 +
 +[[http://www.incompleteideas.net/book/RLbook2020.pdf|Richard S. Sutton and Andrew G. Barto, "Reinforcement Learning - An Introduction", Second Edition, online, 2020]]
 +
 +Das Standardeinführungsbuch für Reinforcement Learning.
 +
 +[[https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf|Volodymyr Mnih et al., "Human-level control through deep reinforcement learning", Nature, Vol. 518, 2015]], [[https://www.nature.com/articles/nature14236|Verlagsseite bei Nature]]
 +
 +Die Veröffentlichung von den Leuten von [[https://de.wikipedia.org/wiki/DeepMind|Deepmind]], die mit Reinforcement Learning gelernt haben Atari Spiele wie [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] oder Space Invaders zu spielen. Sensationell. In einem [[https://static-content.springer.com/esm/art%3A10.1038%2Fnature14236/MediaObjects/41586_2015_BFnature14236_MOESM124_ESM.mov|Video auf der Natureseite]] kann man sehen wie sich das Spielverhalten für breakout mit mehr gespielten Spielen immer weiter verbessert.
 +
 +
  • ai.1417095654.txt.gz
  • Last modified: 2014/11/27 14:40
  • by beckmanf