Podczas Google I/O 2026 firma Google zaprezentowała funkcję, która redefiniuje sposób tworzenia dokumentów. Docs Live pozwala Ci werbalnie wyrzucić z siebie wszystko, co masz w głowie — nieuporządkowane myśli, dygresje, poprawki i strumień świadomości — a Gemini w czasie rzeczywistym organizuje to w ustrukturyzowany dokument. Bez pisania. Bez formatowania. Bez zarysu. Po prostu mów, a AI zajmie się resztą.
To nie jest zwykła dyktando. Aplikacje do dyktowania, takie jak Otter.ai, przepisują Twoje słowa dosłownie — każde „yyy”, każdą dygresję i każde fałszywe rozpoczęcie zdania. Docs Live interpretuje Twój zamiar i tworzy sformatowany dokument. Mówisz „musimy skontaktować się z klientem w sprawie harmonogramu, a tak, upewnij się też, że Sarah wie o zmianie budżetu, i chyba termin został przesunięty na piątek” — a Docs Live tworzy trzy oddzielne, czytelne zadania do wykonania.
Gmail Live rozszerza tę funkcję na pocztę elektroniczną: tworzenie i odpowiadanie na wiadomości za pomocą głosu z automatycznym dopasowaniem tonu i formatu. Keep Live dodaje obsługę głosową do notatek. Wszystkie funkcje mają być dostępne tego lata dla płatnych subskrybentów.
Najważniejsze wnioski
Docs Live rozwiązuje problem pustej strony, umożliwiając mówienie zamiast pisania. Nie jest to zamiana mowy na tekst — to zamiana pomysłów na dokument. Szczególnie przydatne dla osób, które lepiej myślą werbalnie, mają spotkania jedno po drugim i nie mają czasu na pisanie, lub mają problem z przechodzeniem od myśli do uporządkowanego tekstu.
Jak dokładnie działa Docs Live?
Podczas demonstracji Google użytkownik mówił przez około 90 sekund o aktualizacji projektu — w formie strumienia świadomości, z dygresjami na temat obaw budżetowych i przypomnieniem o terminie dla członka zespołu. Gemini przetwarzał dźwięk w czasie rzeczywistym i wygenerował ustrukturyzowany dokument zawierający:
| Co mówisz | Co tworzy Docs Live |
|---|---|
| Rozwlekła aktualizacja projektu z dygresjami | Uporządkowane sekcje: Status, Problemy, Zadania do wykonania |
| „Sarah musi wiedzieć o tej sprawie budżetowej” | Zadanie: „Powiadom Sarah o zmianie budżetu” |
| „Chyba termin został przesunięty… był na piątek?” | Uwaga: „Sprawdź — termin mógł zostać przesunięty na piątek” |
| Poprawka w trakcie zdania | Używa poprawionej wersji, ignoruje fałszywe rozpoczęcie |
Następnie użytkownik mógł normalnie edytować dokument lub kontynuować dodawanie treści głosowo. Google wspomniało również, że w przyszłych wersjach będzie możliwe tworzenie nowych dokumentów i edycja istniejących wyłącznie za pomocą poleceń głosowych — bez żadnej interakcji z klawiaturą.
---📬 Korzystasz z tych treści? Pisujemy o funkcjach AI, które zmieniają codzienną pracę. Otrzymuj je na swoją skrzynkę →
---Jak Gmail Live zmienia pracę z pocztą?
Gmail Live dodaje obsługę głosu do zarządzania pocztą elektroniczną. Zamiast pisać odpowiedzi, mówisz je, a Gemini odpowiednio je formatuje — dopasowując ton i długość do kontekstu rozmowy. Szybkie potwierdzenie otrzymuje krótką, swobodną odpowiedź. Szczegółowa odpowiedź dla klienta otrzymuje właściwą strukturę i profesjonalny ton.
W połączeniu z Gemini Spark, który w tle zajmuje się segregowaniem wiadomości, cały proces wygląda następująco: Spark identyfikuje ważne maile i priorytetuje je → przeglądasz Codzienny Podsumowanie → odpowiadasz głosowo na pilne sprawy przez Gmail Live → Spark przygotowuje odpowiedzi na mniej ważne maile, które akceptujesz jednym kliknięciem.
Obietnica: cały proces obsługi poczty skróci się od ponad 2 godzin czytania, pisania i formatowania do 30 minut spędzonych na głosowym przeglądaniu i akceptowaniu. Czy ta obietnica się sprawdzi w praktyce, zależy od tego, jak dobrze Gemini interpretuje zamiar wyrażony głosem — dowiemy się tego, gdy latem ruszy wersja beta.
Jak to się ma do istniejących narzędzi do dyktowania?
| Narzędzie | Co robi | Wynik |
|---|---|---|
| Google Docs Voice Typing | Przepisuje mowę na tekst | Surowy tekst (formatujesz ręcznie) |
| Otter.ai | Przepisuje i<|eos|> |