University · Artificial Intelligence · Deep Learning
Hardware Acceleration for Deep Learning: GPUs, TPUs, and AI Accelerators
4 Abschnitte
Why GPUs accelerate deep learning, CUDA memory hierarchy and parallelism, Google TPUs and systolic array architecture, modern AI accelerators (Cerebras, Graphcore, Groq), mixed-precision training (FP16/BF16), model parallelism and pipeline parallelism for training LLMs.
Inhaltsübersicht
- Why Deep Learning Needs Specialised Hardware: CPUs vs GPUs
- CUDA Programming Model and GPU Memory Hierarchy
- Google TPUs, Systolic Array Architecture, and Mixed-Precision Training
- Modern AI Accelerators and Parallel Training Strategies for Large Models
📚 Vollständiges Lernmaterial mit 4 Abschnitten, Karteikarten und Quizzen verfügbar nach Anmeldung.
Jetzt kostenlos lernen →Related Topics
Interaktiv lernen mit Karteikarten & Quizzen
Melde dich an und lerne Deep Learning mit intelligenten Wiederholungen, Quizzen und KI-Lernhilfen. 7 Tage kostenlos.
Kostenlos testen