Google Veo 3.1 je nejkomplexnější model umělé inteligence pro generování videa pro rok 2026: silně se drží zadání, má nativně synchronizovaný zvuk a výstup v rozlišení 4K. Představit si ho v rozpočtu však musíte s ohledem na jeden detail. Model generuje ve 720p nebo 1080p a 4K je dosaženo pomocí upscaleru od Googlu, nikoli nativním vykreslováním. Tento průvodce vysvětlí, co Veo 3.1 skutečně umí, kolik stojí, kam směřuje a kam ne. Doplňuje náš pohled na Seedance 2.0 a širší průvodce generováním videa pomocí AI pro rok 2026.
Co je Google Veo 3.1?
Veo 3.1 je vlajkovým modelem Google DeepMind pro převod textu a obrazu na video. Byl spuštěn v říjnu 2025 se synchronizovaným zvukem, poté v lednu 2026 získal aktualizaci s rozlišením 4K a kreativním ovládáním, která přidala funkci „Ingredients to Video“. Jediné spuštění vrátí 8sekundový klip při 24 snímcích za sekundu s dialogem, zvukovými efekty, okolním hlukem a hudbou generovanou v souladu s obrazem. Přístup probíhá prostřednictvím aplikace a API Gemini, Google Flow, Google Vids, Vertex AI a YouTube Shorts.
Jaké jsou specifikace a ceny Veo 3.1?
Čísla považujte za zveřejněné hodnoty pro rok 2026; Google často reviduje úrovně.
| Specifikace / úroveň | Veo 3.1 |
|---|---|
| Vývojář | Google DeepMind |
| Vydáno | Říjen 2025 · Aktualizace 4K Leden 2026 |
| Délka klipu | 4, 6 nebo 8 sekund při 24 snímcích za sekundu |
| Nativní vykreslování | 720p nebo 1080p |
| 4K | přes zvětšovač Googlu (není nativní) |
| Poměry stran | 16:9 a 9:16 |
| Audio | nativní, synchronizováno: dialog + zvukové efekty + ruchy + hudba |
| Náklady na API | $0.10/s (720p) · ~$0,40/s (1080p, audio) · ~$0,60/s (4K, audio) |
| Předplatná | Google AI Pro 19,99 $ měsíčně (rychlý) · AI Ultra 249,99 $ měsíčně (plný) |
| Varianty | Veo 3.1 · 3.1 Fast · 3.1 Lite |
| Přístup | Aplikace/API Gemini, Flow, Vids, Vertex AI, YT Shorts |
Jak moc dobrý je ten 4K, opravdu?

Méně nativní, než se zdá. Veo 3.1 vykresluje v rozlišení 720p nebo 1080p a údaj 4K pochází z převzorkování, nikoli ze skutečného generování 4K. Pro většinu sociálních a webových použití je tento rozdíl sotva patrný, protože přeškálované video v rozlišení 1080p vypadá na telefonu nebo v kanálu ostře. Na velkém displeji nebo v projektu, který vyžaduje skutečné detaily, není přeškálování totéž co snímek 4K ze senzoru. Specifikaci čtěte jako "1080p, které můžete zvětšit na 4K", nikoli jako "nativní 4K".
Kolik stojí Veo 3.1 v praxi?
Více, než se na první pohled zdá, protože zvuk a rozlišení se připočítávají k základní sazbě. Ceny API začínají od 0,10 dolarů za sekundu při 720p až po zhruba 0,60 dolarů za sekundu pro 4K se zvukem, takže 8sekundový 4K klip se zvukem se dostane téměř na 5 dolarů před jakýmikoli opakovanými pokusy. Předplatné tuto cenu pro běžné používání zmírňuje: Google AI Pro za 19,99 dolarů měsíčně kombinuje rychlejší model Veo 3.1 Fast s kreditovým zůstatkem, zatímco AI Ultra za 249,99 dolarů měsíčně odemyká model v plné kvalitě pro velký objem výstupů. Rozpočtujte po sekundách a počítejte s několika pokusy na použitelný záběr.
Jak si Veo 3.1 vede ve srovnání se Seedance 2.0 a Kling 3.0?
Volte podle záběru, ne podle značky. Veo 3.1 si zaslouží označení univerzál, protože kombinuje nejsilnější dodržování pokynů v oboru s nativním zvukem a možností upgradu na 4K, což je ideální pro narativní scény a propracované hlavní záběry. Seedance 2.0 naproti tomu nabízí generování podle zvuku jako první a synchronizaci rtů na úrovni fonémů, ačkoli jeho rozlišení je omezeno na 720p. Kling 3.0 vítězí v ceně za iteraci a režimu storyboardu s více záběry. Jednoduché pravidlo: Veo pro věrnost a kontrolu nad pokyny, Seedance pro mluvící postavy, Kling pro objem.
Jaké jsou limity Veo 3.1?
Délka a rychlost záznamu. Každá generace se zastaví na 8 sekundách, takže jakákoliv delší sekvence vyžaduje spojování přes klipy a udržení kontinuity mezi oddělenými běhy stojí úsilí. Kredity se navíc na nejvyšší úrovni rychle vyčerpávají, protože cena za 4K se zvukem promění pár desítek záběrů v reálné peníze. Základní model, který nerenderuje nativní 4K, uzavírá seznam. Žádný z těchto problémů není překážkou pro krátké, vysoce kvalitní scény, což je přesně práce, kterou Veo 3.1 zvládá nejlépe.
Kdo by měl používat Veo 3.1?
Tvůrci, kteří potřebují co nejčistší záběr na jeden záběr a můžou si ho dovolit. Pokud projekt žije na přesnosti zadání, synchronizovaném zvuku a ostrém výsledku pro krátké narativní nebo reklamní klipy, Veo 3.1 bude v roce 2026 nejbezpečnější volbou. Pro dlouhé běhy, intenzivní iterace v rámci rozpočtu nebo čistě mluvící hlavy se lépe hodí levnější model nebo model specializovaný na zvuk. Pro úplnou sadu metod, které stojí za těmito nástroji, začněte s naším Průvodcem umělou inteligencí pro video 2026.
Konečný výsledek
Veo 3.1 je univerzál pro AI video roku 2026: nejlepší ve své třídě co do přesnosti promtů, nativního synchronizovaného zvuku a rozlišení 4K pomocí upscaleru, s cenou od 0,10 do přibližně 0,60 USD za sekundu. Sáhněte po něm, když potřebujete jeden krátký, vysoce věrný záběr se zvukem, a přepněte na cenově výhodný model nebo model zaměřený na zvuk, když je rozhodující délka, objem nebo rozpočet. Kde se umisťuje mezi ostatními, najdete v porovnání s Seedance 2.0.






