OpenAI Whisper Einrichtung (Sprache-zu-Text)
Installieren Sie das OpenAI Whisper-Modell und konvertieren Sie Audiodateien in Text.
Setup Steps
1. Install ffmpeg (required for audio processing):
sudo apt install ffmpeg2. Install Whisper via pip:
pip install openai-whisper3. Command line usage:
whisper audio_file.mp3 --language English --model medium4. Available models (smallest to largest): tiny, base, small, medium, large-v3
5. Python usage:
python
import whisper
model = whisper.load_model("medium")
result = model.transcribe("audio_file.mp3", language="en")
print(result["text"])6. Subtitle format output:
whisper audio.mp3 --language en --output_format srt7. GPU accelerated usage:
python
model = whisper.load_model("large-v3", device="cuda")8. Faster Whisper alternative (faster):
pip install faster-whisperpython
from faster_whisper import WhisperModel
model = WhisperModel("large-v3", device="cuda")
segments, info = model.transcribe("audio.mp3", language="en")
for segment in segments:
print(f"[{segment.start:.2f}s -> {segment.end:.2f}s] {segment.text}")Related Guides
Claude Code Einrichtung
Installieren Sie das Anthropic Claude Code CLI-Tool auf Ihrem Server oder PC. API-Schluessel-Konfiguration und grundlegende Befehle.
ChatGPT API Einrichtung
Integrieren Sie die OpenAI ChatGPT API in Ihr Projekt. API-Schluessel und erste Anfrage.
Google Gemini API Einrichtung
Richten Sie die Google Gemini API ein und verwenden Sie sie in Ihren Projekten.
Midjourney Nutzungsanleitung
Erstellen Sie KI-gestuetzte Bilder mit Midjourney. Schritt-fuer-Schritt Discord-Anleitung.