Zum Hauptinhalt springen
Technologie

KI-Assistenten im Alltag sehbehinderter Menschen

Künstliche Intelligenz hat das Potenzial, die Alltagsselbstständigkeit sehbehinderter Menschen spürbar zu erhöhen – von der Dokumentenerkennung bis zur Raumorientierung. Doch welche Tools halten, was sie versprechen?

Einleitung: KI verändert den Alltag

Lange Zeit waren Hilfsmittel für sehbehinderte Menschen auf klassische Screenreader, Lupen und Spezialhardware beschränkt. In den letzten zwei Jahren hat sich durch großsprachige KI-Modelle wie ChatGPT, Gemini und Claude eine völlig neue Kategorie von Alltagswerkzeugen etabliert. Diese Assistenten können nicht nur Texte vorlesen, sondern Bilder beschreiben, Dokumente analysieren, E-Mails zusammenfassen und komplexe Fragen beantworten – alles per Spracheingabe oder einfachem Tastendruck. Für sehbehinderte Menschen ergeben sich daraus praktische Möglichkeiten, die früher teure Spezialsoftware oder menschliche Assistance erforderten. Dieser Artikel gibt einen umfassenden Überblick über die aktuellen KI-Assistenten, ihre Stärken und Schwächen im barrierefreien Alltag und konkrete Anwendungsszenarien, die Sie sofort ausprobieren können.

ChatGPT Advanced Voice Mode: Echtzeit-Unterhaltung

Der Advanced Voice Mode von ChatGPT (verfügbar in der Plus- und kostenlosen Version) ist für sehbehinderte Menschen einer der wichtigsten technologischen Durchbrüche der letzten Jahre. Anders als beim klassischen Tippen und Vorlesen funktioniert der Voice Mode wie ein echtes Gespräch: Sie sprechen, die KI antwortet in natürlicher Sprache, Sie können unterbrechen, nachfragen und korrigieren – ganz ohne Bildschirmbedienung. Die Latenz liegt unter einer Sekunde, sodass sich ein flüssiges Gesprächsgefühl einstellt. Für VoiceOver- und TalkBack-Nutzer bedeutet das: einmal den Voice-Button aktivieren (auf dem iPhone per Dreifach-Klick auf die Rückseite tippbar), dann liegt das Handy in der Hand und es funktioniert wie ein intelligenter Gesprächspartner.

  • Flüssige Echtzeit-Unterhaltung mit Unterbrechungsmöglichkeit – kein Warten bis die KI ausgeredet hat
  • Neun verschiedene Stimmen, darunter mehrere mit deutscher Sprachausgabe, wählbar in den Einstellungen
  • Multimodal: Foto aufnehmen und per Voice Mode Fragen zum Bild stellen – z. B. „Was steht auf diesem Schild?"
  • Sprachgeschwindigkeit und Stimmlage lassen sich anpassen für angenehme Langzeitnutzung
  • Funktioniert mit WLAN und mobiler Datenverbindung – auch unterwegs einsetzbar
  • Im kostenlosen Modus zeitlich begrenzt, in der Plus-Version nahezu unbegrenzt nutzbar
  • Erkennt automatisch, wenn Sie fertig sprechen – kein manuelles „Senden" nötig

Gemini Live: Googles Konversations-KI

Gemini Live ist Googles Antwort auf den ChatGPT Voice Mode und in der Google-App auf Android und iOS verfügbar. Die Stärke von Gemini liegt in der tiefen Google-Integration: Termine aus Google Calendar, E-Mails aus Gmail, Orte aus Google Maps – all das kann Gemini in die Konversation einbeziehen, wenn Sie es erlauben. Für sehbehinderte Nutzer besonders wertvoll: Sie können sagen „Navigiere mich zum nächsten Bäcker" und Gemini gibt Schritt-für-Schritt-Anweisungen. Die Sprachqualität ist natürlich und flüssig, auf Deutsch mit mehreren Stimmen verfügbar. Gemini Live ist in der kostenlosen Version von Google bereits enthalten, Gemini Advanced mit dem stärksten Modell kostet ca. 22 Euro pro Monat.

  • Nahtlose Integration mit Google-Ökosystem: Calendar, Gmail, Maps, Photos
  • „Passive Unterhaltung": Gemini kann im Hintergrund zuhören und bei Bedarf Informationen ergänzen
  • Kostenlos in der Google-App enthalten – keine separate Installation nötig
  • Bildanalyse direkt im Gespräch: Foto aufnehmen und sofort per Sprache nachfragen
  • Gemini Advanced (ca. 22 €/Monat) für komplexere Aufgaben und längere Gespräche
  • Auf Android tiefer in TalkBack integriert als auf iOS, wo VoiceOver-Support noch Lücken hat
  • Spracherkennung auch bei Hintergrundgeräuschen robust – ideal für Outdoor-Nutzung

Claude Voice: Anthropics präziser Assistent

Claude von Anthropic hat sich als einer der präzisesten KI-Assistenten etabliert, besonders bei der Analyse längerer Dokumente und komplexer Zusammenhänge. Seit Ende 2025 bietet Claude einen nativen Voice Mode in der iOS- und Android-App, der für sehbehinderte Nutzer eine Alternative zu ChatGPT darstellt. Claudes Stärke ist die Texttreue: Wenn Sie ein 20-seitiges PDF hochladen und sagen „Fasse die wichtigsten Punkte zusammen", liefert Claude in der Regel strukturiertere und vollständigere Ergebnisse als die Konkurrenz. Der Voice Mode ist flüssig, currently aber noch auf Englisch am stärksten – Deutsch wird unterstützt, kann aber gelegentlich weniger natürlich klingen. Die Kostenlose Version erlaubt eine begrenzte Anzahl Nachrichten pro Tag.

  • Hervorragend für lange Dokumente: PDFs, Verträge, wissenschaftliche Paper präzise zusammenfassen
  • Natürlicher Voice Mode mit guter Reaktionszeit, auf Deutsch verfügbar
  • Klare, strukturierte Antworten – ideal für komplexe Fragestellungen
  • Kostenlose Version mit begrenztem Nachrichtenkontingent, Pro für ca. 18 €/Monat
  • Aufgeräumte Oberfläche mit guter VoiceOver- und TalkBack-Unterstützung
  • Datenschutz: Anthropic bietet einen „Data Processing Addendum" für Nutzer, die keine Datenverwertung wünschen
  • Schwäche: Weniger Bildanalyse-Funktionen als ChatGPT Vision oder Gemini

Apple Intelligence 2025/2026: KI direkt im iPhone

Mit iOS 18 hat Apple 2025 „Apple Intelligence" eingeführt – eine direkt ins Betriebssystem integrierte KI, die auf dem iPhone läuft und keinen separaten Login oder Abo benötigt. Für sehbehinderte Nutzerinnen und Nutzer besonders relevant ist die Funktion „Visual Intelligence" auf dem iPhone 16: Halten Sie die Kamera auf ein Objekt, eine Speisekarte oder ein Schild, beschreibt Siri in Echtzeit, was zu sehen ist. Da die Verarbeitung teilweise lokal auf dem Gerät stattfindet (Private Cloud Compute), ist die Funktion schnell und datenschutzfreundlich. Apple Intelligence kann zudem Benachrichtigungen zusammenfassen, E-Mails priorisieren und Texte umformulieren – alles per Sprachbefehl an Siri. Die tiefe Integration in VoiceOver bedeutet, dass alle Funktionen ohne zusätzliche Apps nutzbar sind.

  • Visual Intelligence: Kamera auf Objekt richten, Siri beschreibt in Echtzeit – ideal für Schilder, Speisekarten, Produkte
  • Teilweise lokale Verarbeitung auf dem Gerät (Apple A17 Pro / A18 Chip) – schnell und datenschutzfreundlich
  • Siri ist deutlich natürlicher geworden: versteht Kontext, kann Folgefragen stellen, erinnert sich an Gesprächsverlauf
  • „Clean Up" in Fotos: störende Objekte aus Bildern entfernen – nützlich, wenn man Bilder für Präsentationen oder Social Media vorbereitet
  • Zusammenfassung von Benachrichtigungen: Siri gruppiert und fasst zusammen, was wichtig ist
  • Vollständig in VoiceOver integriert – keine zusätzliche App, kein Login, kein Abo
  • Verfügbar ab iPhone 15 Pro und iPhone 16-Serie, mit iOS 19 ( Herbst 2026) weitere Funktionen erwartet

Microsoft Copilot Voice: Der Windows-Begleiter

Microsoft Copilot ist seit 2025 fest in Windows 11 und die Office-Anwendungen integriert und bietet mit dem Voice Mode eine vollwertige Sprachsteuerung. Für sehbehinderte Menschen, die am Computer arbeiten, eröffnet das neue Möglichkeiten: In Word kann Copilot Texte vorlesen, zusammenfassen oder umformatieren. In Excel liest er Tabelleninhalte vor und hilft bei Formeln. In Outlook fasst er lange E-Mail-Threads zusammen und entwirft Antworten. Die Integration in den Narrator-Bildschirmleser von Windows ist gut, Copilot kann auch per Spracheingabe bedient werden. Auf dem Smartphone (iOS und Android) bietet die Copilot-App einen eigenen Voice Mode, der ähnlich wie ChatGPT funktioniert. Die kostenlose Version reicht für die meisten Alltagsaufgaben aus.

  • Voice Mode in Windows 11: „Copilot"-Taste drücken oder Windows+C, dann per Sprache kommunizieren
  • In Word: Texte markieren und sagen „Lies mir das vor" oder „Fasse diesen Absatz zusammen"
  • In Excel: Tabelleninhalte ansagen lassen, Formeln erklären, Daten filtern per Sprachbefehl
  • In Outlook: E-Mail-Threads zusammenfassen, Antwortentwürfe erstellen, Termine aus E-Mails extrahieren
  • Kostenlose Version mit GPT-4o, Copilot Pro für ca. 11 €/Monat mit Office-Integration
  • Narrator-Integration: Copilot liest Windows-Dialoge, Systemmeldungen und Dateiinhalte vor
  • Auf dem Smartphone weniger optimiert als Konkurrenz – Sprachqualität und VoiceOver-Support verbessern sich aber kontinuierlich

ChatGPT, Gemini & Co. als Everyday-Companion

Die bekanntesten KI-Assistenten – ChatGPT von OpenAI, Gemini von Google und Claude von Anthropic – eignen sich als tägliche Begleiter. Mit der Sprachausgabe-Funktion (Voice Mode bei ChatGPT, Sprachfunktion bei Gemini) lassen sich Gespräche führen, die an eine menschliche Interaktion erinnern. Praktisch wird es bei konkreten Aufgaben: Ein Foto von der Speisekarte gemacht, die KI liest die Gerichte vor und beantwortet Fragen zu Inhaltsstoffen. Ein Foto vom Briefkasten, und die KI fasst den Inhalt des Briefes zusammen. Wer VoiceOver auf dem iPhone oder TalkBack auf Android nutzt, kann die Apps weitgehend per Gesten und Sprache bedienen.

  • Dokumente fotografieren und vorlesen lassen – auch handschriftliche Notizen und ausgefüllte Formulare
  • Beschriftungen auf Verpackungen erkennen und Nährwerte, Allergene und Zubereitungshinweise zusammenfassen
  • E-Mails diktieren und von der KI formatieren, kürzen oder höflicher formulieren lassen
  • Tagesplanung: Termine, Aufgaben und Erinnerungen per Sprache verwalten – inklusive Priorisierung
  • Recherche: „Suche nach dem nächsten Optiker in meiner Nähe, der Termin online buchbar ist" – die KI liefert strukturierte Ergebnisse
  • Übersetzungen: Fremdsprachige Dokumente oder Websites übersetzen und zusammenfassen lassen
  • Kreatives: Gedichte, Geschichten oder Geburtstagsgrüße formulieren – die KI hilft beim Formulieren

Lokale KI vs. Cloud-KI: Datenschutz und Performance

Ein wichtiger Aspekt bei der Wahl des KI-Assistenten ist die Frage, wo die Datenverarbeitung stattfindet. Cloud-KI-Modelle wie ChatGPT, Gemini und Claude senden Ihre Anfragen an Server im Internet, verarbeiten sie dort und schicken die Antwort zurück. Das ermöglicht leistungsstarke Modelle, erfordert aber eine ständige Internetverbindung und bedeutet, dass Ihre Daten das Gerät verlassen. Lokale KI-Modelle, die direkt auf dem Smartphone oder Computer laufen, sind datenschutzfreundlicher und funktionieren auch offline. Apple Intelligence und Google Gemini Nano sind Beispiele für On-Device-KI, die ohne Cloud auskommt. Der Nachteil: Lokale Modelle sind kleiner und damit weniger leistungsstark. Die Wahl hängt vom Anwendungsfall ab.

  • Cloud-KI (ChatGPT, Gemini Advanced, Claude): Maximale Leistung, komplexe Analysen, Bilderkennung – aber Internet nötig, Daten verlassen das Gerät
  • On-Device-KI (Apple Intelligence, Gemini Nano): Schneller, datenschutzfreundlich, offline-fähig – aber begrenzte Modellgröße und -fähigkeit
  • Hybrid-Modelle (Apple Private Cloud Compute): Sensible Aufgaben lokal, komplexe in privater Cloud – bester Kompromiss aus Leistung und Datenschutz
  • Open-Source-Modelle lokal (Llama, Mistral): Mit technischem Wissen auf dem eigenen Rechner lauffähig, volle Datenkontrolle
  • Faustregel: Für alltägliche Fragen reicht On-Device-KI; für Dokumentanalysen und Bildbeschreibungen ist Cloud-KI deutlich überlegen
  • Datenschutz-Bewertung: Apple > Google > OpenAI > Anthropic bei Datenminimierung, aber alle bieten Opt-out vom Training an
  • Bei Cloud-KI immer „Training mit meinen Daten deaktivieren" in den Einstellungen einschalten

Datenschutz-Bewertung der Anbieter im Vergleich

Wer KI-Assistenten im Alltag nutzt, gibt persönliche Daten Preis – Fotos der eigenen Wohnung, Gesundheits- und Finanzdokumente, Kommunikationsinhalte. Ein bewusster Umgang ist wichtig. Hier eine Einordnung der großen Anbieter nach Datenschutz-Kriterien:

  • Apple Intelligence: Daten bleiben auf dem Gerät oder in verschlüsselter Private Cloud – kein Training mit Nutzerdaten, beste Datenschutz-Bewertung
  • Google Gemini: Daten können für Modellverbesserung genutzt werden, Opt-out in den Aktivitätseinstellungen möglich – durchschnittlicher Datenschutz
  • ChatGPT (OpenAI): Standardmäßig werden Konversationen für Training verwendet – Opt-out in Settings → Data Controls unbedingt aktivieren
  • Claude (Anthropic): Bietet „Data Processing Addendum" an, trainiert nur mit Opt-in – guter Datenschutz, aber Server in den USA
  • Microsoft Copilot: An Microsoft 365 gebunden, kommerzielle Datenschutz-Standards für Geschäftskunden, für Privatnutzer gelten die allgemeinen Microsoft-Datenschutzrichtlinien
  • Goldene Regel: Niemals Steuer-IDs, Krankenkassennummern, Bankzugangsdaten oder sensible Gesundheitsdaten in KI-Chats eingeben
  • Für hochsensible Dokumente: Lokale OCR-Lösungen wie KNFB Reader, Prizmo oder Microsoft Lens (offline-Modus) verwenden

Konkretes Alltagsszenario 1: Kochrezept vorlesen lassen

Stellen Sie sich vor, Sie möchten ein neues Gericht kochen, haben aber das Rezept nur auf einer Verpackung oder in einem Kochbuch mit kleiner Schrift. Mit einem KI-Assistenten ist das kein Problem mehr. Der gesamte Workflow lässt sich per Sprache erledigen – ohne Bildschirmablesen oder Lupe.

  • Schritt 1: Foto der Verpackung oder Rezeptseite mit ChatGPT oder Be My AI aufnehmen
  • Schritt 2: Sagen Sie „Lies mir das Rezept vor und gib mir eine Einkaufsliste" – die KI strukturiert Zutaten und Schritte
  • Schritt 3: Beim Kochen Voice Mode aktivieren und sagen „Lies mir Schritt 3 vor" oder „Wie lange muss die Pasta noch kochen?"
  • Schritt 4: Bei Unklarheiten nachfragen: „Kann ich Butter durch Margarine ersetzen?" – die KI gibt Empfehlungen
  • Schritt 5: Timer per Sprache stellen: „Stelle einen Timer auf 12 Minuten" – direkt im iPhone oder über den KI-Assistenten
  • Schritt 6: Portionen anpassen: „Ich brauche das Rezept für 4 Personen statt 2" – die KI rechnet die Mengen um
  • Praxistipp: Hände frei beim Kochen – Voice Mode mit Freisprecheinrichtung oder Lautsprecher nutzen

Konkretes Alltagsszenario 2: Medikament-Informationen abfragen

Die Medikamentenverpackung ist klein gedruckt, der Beipackzettel ist mehrfach gefaltet und schwer zu entziffern. KI-Assistenten können hier enorme Erleichterung bringen – aber es gilt, die Ergebnisse kritisch zu prüfen, denn bei Gesundheitsfragen sind Fehler riskant.

  • Foto der Verpackung mit Seeing AI oder ChatGPT Vision aufnehmen – Wirkstoffname, Dosierung und Hersteller werden erkannt
  • „Wie oft soll ich dieses Medikament einnehmen?" – die KI liest die Dosierungsempfehlung vor
  • „Welche Nebenwirkungen sind möglich?" – die KI fasst die häufigsten Nebenwirkungen verständlich zusammen
  • „Darf ich das zusammen mit Ibuprofen einnehmen?" – die KI warnt bei bekannten Wechselwirkungen, empfiehlt aber immer, Rücksprache mit Arzt oder Apotheker zu halten
  • Beipackzettel komplett fotografieren und sagen „Fasse die wichtigsten Punkte für mich zusammen" – die KI strukturiert nach Dosierung, Nebenwirkungen und Gegenanzeigen
  • WICHTIG: KI-Antworten sind nie ein Ersatz für ärztlichen Rat – bei Unsicherheit immer Arzt oder Apotheke kontaktieren
  • Datenschutz-Tipp: Gesundheitdaten nicht in Cloud-KI ohne Opt-out eingeben, oder Anfragen verallgemeinern („Welche Wechselwirkungen hat Wirkstoff X?")

Konkretes Alltagsszenario 3: Dokumente zusammenfassen und bewerten

Rechnungen, Behördenpost, Versicherungsmitteilungen – der Posteingang kann überwältigend sein. Die KI kann nicht nur den Inhalt zusammenfassen, sondern auch Handlungsempfehlungen geben und Fristen extrahieren. Praktischer Workflow: Foto des Briefes mit Seeing AI machen, Text in ChatGPT kopieren und sagen „Fasse das zusammen und sag mir, was ich tun muss." Mit dem Voice Mode geht das sogar vollständig per Sprache ohne Tippen.

  • Foto des Briefes mit Seeing AI „Dokument"-Konal aufnehmen – formatierter Text wird extrahiert
  • Text an ChatGPT senden und sagen: „Was ist hier wichtig? Was muss ich tun und bis wann?"
  • Fristen automatisch erkennen: Die KI extrahiert „Zahlbar bis zum 15.07." oder „Antwort innerhalb von 14 Tagen" strukturiert
  • „Ist das ein wichtiges Schreiben oder Werbung?" – die KI klassifiziert ein und spart Zeit beim Sortieren
  • Verträge analysieren: „Was sind die Kündigungsfristen in diesem Vertrag?" – die KI findet die Klausel und liest sie vor
  • Rechnungen prüfen: „Sind die Beträge plausibel?" – die KI vergleicht Positionen und weist auf Auffälligkeiten hin
  • Mehrsprachige Post: Behördenschreiben auf Deutsch, Italienisch oder Türkisch – die KI übersetzt und fasst zusammen

Praxistest: Barrierefreiheit der KI-Apps

Im direkten Vergleich zeigt sich: ChatGPT (iOS) ist mit VoiceOver am besten nutzbar. Buttons sind korrekt gelabelt, die Navigation ist logisch aufgebaut und der Voice Mode lässt sich per Dreifach-Klick aktivieren. Gemini in der Google-App hat auf Android mit TalkBack eine solide Integration, auf iOS gibt es noch Lücken bei der Beschriftung einzelner Elemente. Claude glänzt durch eine aufgeräumte Oberfläche und exzellente VoiceOver-Unterstützung. Microsoft Copilot profitiert von der langjährigen Narrator-Erfahrung, ist auf Windows-Geräten barrierefrei nutzbar, auf dem Smartphone aber weniger optimiert als die Konkurrenz.

  • ChatGPT iOS: VoiceOver-Labels vollständig, Voice Mode per Back-Tap aktivierbar, klare Navigationsstruktur – Bewertung: sehr gut
  • ChatGPT Android: TalkBack-Integration gut, leicht verzögerte Reaktion bei Voice Mode – Bewertung: gut
  • Gemini Android: Tiefe TalkBack-Integration, da Google-eigen – Bewertung: sehr gut
  • Gemini iOS: VoiceOver-Lücken bei einigen Buttons, immer noch Verbesserungsbedarf – Bewertung: befriedigend
  • Claude iOS/Android: Aufgeräumtes Interface, VoiceOver/TalkBack-Labels korrekt, Voice Mode zugänglich – Bewertung: gut
  • Microsoft Copilot Windows: Exzellente Narrator-Integration, Sprachsteuerung nativ – Bewertung: sehr gut
  • Microsoft Copilot iOS/Android: Solide, aber weniger optimiert als Konkurrenz – Bewertung: befriedigend

Sprachinteraktion: Tipps für den Voice Mode

Der Voice Mode von ChatGPT und die Sprachfunktion von Gemini und Claude sind für sehbehinderte Menschen ein Gamechanger, weil sie die Bedienung komplett ohne Bildschirm ermöglichen. Einige Tipps für eine reibungslose Nutzung:

  • Sprechen Sie klar und in ganzen Sätzen – die KI versteht auch umgangssprachlich, aber klare Formulierungen verbessern die Ergebnisse
  • Nutzen Sie Sprachbefehle wie „Lies mir das vor", „Fasse zusammen" oder „Beschreibe das Bild" für schnelle Aktionen
  • Wenn die KI etwas Falsches versteht: einfach „Nein, ich meinte …" sagen statt von vorn beginnen
  • Voice Mode für mehrstufige Aufgaben nutzen: erst Foto machen, dann per Sprache nachfragen, dann Ergebnis diktionieren lassen
  • Unterbrechungen sind erlaubt: Bei ChatGPT kann man mitten reinreden, um nachzufragen – wie in einem echten Gespräch
  • Kopfhörer mit Mikrofon verbessern die Spracherkennung in lauter Umgebung deutlich
  • Bei längeren Gesprächen die Spracheinstellung auf Deutsch stellen, damit die Antworten in der richtigen Sprache kommen

Kostenvergleich 2026: Was ist kostenlos, was kostet Geld?

Die meisten KI-Assistenten bieten eine kostenlose Basisversion an, die für viele Alltagsaufgaben bereits ausreicht. Hier eine detaillierte Übersicht der wichtigsten Modelle Stand Frühjahr 2026:

  • ChatGPT Free: GPT-4o-mini, Bildanalyse, Voice Mode (zeitlich begrenzt) – für grundlegende Alltagssituationen ausreichend
  • ChatGPT Plus: ca. 23 €/Monat – GPT-4o, erweiterter Voice Mode (nahezu unbegrenzt), Datenanalyse, Priorisierte Antwortzeiten
  • Gemini Free: In Google-App enthalten, Bildanalyse, Sprachfunktion, Grundfunktionen – kostenlos für alle Android-Nutzer
  • Gemini Advanced: ca. 22 €/Monat – Gemini Ultra, längere Gespräche, tiefere Integration mit Google Workspace
  • Claude Free: Begrenzte Nachrichten pro Tag, Voice Mode inkludiert – gut für Gelegenheitsnutzer
  • Claude Pro: ca. 18 €/Monat – Mehr Nachrichten, längere Dokumente, erweiterter Voice Mode
  • Apple Intelligence: Im iPhone-Preis enthalten, kein Abo – Visual Intelligence nur ab iPhone 16
  • Microsoft Copilot Free: In Windows 11 und Edge enthalten, GPT-4o-basiert – gut für Büro-Aufgaben
  • Copilot Pro: ca. 11 €/Monat – Office-Integration, erweiterte KI-Funktionen, Priorisierter Support
  • Be My AI, Seeing AI, Lookout, TapTapSee: Komplett kostenlos – keine versteckten Kosten oder In-App-Käufe
  • Empfehlung: Kostenlos anfangen (Be My AI + ChatGPT Free), bei intensiver Nutzung Plus-Abo erwägen

Vergleich: Be My Eyes vs. Seeing AI vs. ChatGPT Vision

Be My Eyes verbindet seit 2025 mit einem KI-Feature (Be My AI) sehbehinderte Nutzer automatisch mit einer Bildbeschreibungs-KI, ohne dass ein Mensch anwesend sein muss. Seeing AI von Microsoft bietet etablierte Funktionen wie Dokumentenscan, Produkterkennung und Lichterkennung, ist aber auf eine Beschreibung pro Foto beschränkt. ChatGPT Vision bietet die flexibelste Lösung: Sie können nachfragen, Details klären und mehrstufige Analysen durchführen. Der Nachteil: Es erfordert ein Abonnement (Plus für ca. 23 Euro/Monat) und eine aktive Internetverbindung. Be My Eyes ist kostenlos, Seeing AI ebenfalls. Für den Einstieg empfiehlt sich Be My AI als kostenlose Lösung, für fortgeschrittene Nutzer lohnt sich ChatGPT Plus.

Lernressourcen und Weiterkommen

Wer sich systematisch in KI-Assistenten einarbeiten möchte, findet gute Ressourcen: Der DVBS (Deutscher Verein der Blinden und Sehbehinderten in Studium und Beruf) bietet regelmäßig Webinare zu KI-Themen an. Der DBSV (Deutscher Blinden- und Sehbehindertenverband) hat auf seiner Website Anleitungen zu Seeing AI und Be My Eyes. Auf YouTube gibt es deutschsprachige Tutorials von sehbehinderten Content-Creatorinnen und Creators, die die Apps in der Praxis zeigen.

  • DVBS-Webinare zu KI-Themen (dvbs-online.de) – regelmäßig neue Termine, auch als Aufzeichnung
  • DBSV-Website mit App-Anleitungen und Datenschutz-Leitfäden (dbsv.org)
  • YouTube-Tutorials von sehbehinderten Creatorinnen und Creators – Praxis in Echtzeit
  • Selbsthilfegruppen vor Ort für Erfahrungsaustausch und gegenseitige Hilfe beim Einrichten
  • BliBla – Online-Community für blinde und sehbehinderte Menschen mit aktiven KI-Threads
  • OpenAI-Hilfeseite: Ausführliche Anleitungen zum Voice Mode (auch auf Deutsch)
  • Podcasts: „Sehbehindert und trotzdem mobil“, „Blind in der Technikwelt“ – regelmäßig KI-Themen

Fazit und Empfehlungen

KI-Assistenten sind kein Ersatz für bewährte Hilfsmittel wie Screenreader oder Blindenlangstock – aber eine wertvolle Ergänzung, die Alltagssituationen vereinfacht, die früher fremde Hilfe benötigten. Für den Einstieg empfiehlt sich: Be My AI kostenlos testen, parallel ChatGPT in der Gratisversion ausprobieren. Wer regelmäßig Dokumente und Bilder analysieren will, sollte ChatGPT Plus in Betracht ziehen. Wer ein iPhone 16 hat, sollte Visual Intelligence ausprobieren – es ist bereits im System integriert. Am Computer ist Microsoft Copilot die einfachste Lösung, da keine separate Installation nötig ist. Wichtig bleibt, die Datenschutz-Einstellungen zu prüfen und sensible Daten bewusst zu behandeln. Die Entwicklung geht schnell weiter – es lohnt sich, alle paar Monate neue Funktionen zu testen.

  • Einsteiger: Be My AI (kostenlos) + ChatGPT Free + Seeing AI – ab Tag 1 einen spürbaren Nutzen
  • Intensivnutzer: ChatGPT Plus (23 €/Monat) für Voice Mode, Bildanalyse und Dokumentverarbeitung
  • iPhone-16-Nutzer: Apple Visual Intelligence aktivieren – bereits im Preis enthalten
  • Windows-Nutzer: Copilot in Windows 11 ausprobieren – keine Installation nötig
  • Android-Nutzer: Gemini in der Google-App als Alltagsbegleiter, Lookout für Bildbeschreibung
  • Datenschutz: Training mit eigenen Daten in allen Apps deaktivieren
  • Regelmäßig updaten: Alle 2–3 Monate neue Funktionen testen – die Entwicklung ist rasant