Podporované formáty souborů: které zvukové a video soubory můžete přepsat
Jedna z nejčastějších otázek před prvním nahráním: “Je můj formát souboru podporován?” Krátká odpověď: s velmi vysokou pravděpodobností ano. scryp přijímá přes 50 zvukových formátů a přes 50 video formátů – od běžných standardů jako MP3 a MP4 až po profesionální formáty jako FLAC, AC3 nebo MKV. Tento článek uvádí všechny podporované formáty, vysvětluje, jak funguje automatický převod, a co mít na paměti ohledně kvality nahrávky.
Proč tolik formátů? Převodní engine scryp
scryp má vlastní převodní engine, který dokáže zpracovat prakticky jakýkoli běžný zvukový a video formát. Před přepisem se každý nahraný soubor automaticky převede do optimalizovaného formátu – bez ohledu na zdrojový formát.
Postup podrobně: nahrajete soubor v jakémkoli podporovaném formátu. Náš engine automaticky extrahuje zvukovou stopu (u videí se video stopa zahodí) a převede ji do standardizovaného formátu WAV se vzorkovací frekvencí 16 kHz a mono kanálem. Tento formát je optimální pro rozpoznávání řeči pomocí AI. Nikdy tedy nemusíte přemýšlet o kodecích, vzorkovacích frekvencích nebo počtu kanálů – vše probíhá zcela automaticky.
Podporované zvukové formáty (50+)
Následující seznam ukazuje nejběžnější zvukové formáty, které scryp přijímá přímo. Pokud je váš formát zde, můžete soubor nahrát bez jakékoli přípravy:
- MP3 (.mp3) – Nejrozšířenější zvukový formát. Komprimovaný, dobrý kompromis mezi velikostí souboru a kvalitou. Ideální pro nahrávky z chytrých telefonů a diktafonů.
- WAV (.wav) – Nekomprimovaný formát s plnou kvalitou zvuku. Standard v profesionální zvukové produkci. Větší soubory, ale nejlepší přesnost přepisu.
- M4A / AAC (.m4a, .aac) – Standardní zvukový formát od Applu. Používaný iPhony, iPady a macOS. Lepší kvalita než MP3 při stejné velikosti souboru.
- OGG / Vorbis (.ogg, .oga) – Open-source formát s dobrou kompresí. Běžný na linuxových systémech a ve webových aplikacích.
- FLAC (.flac) – Bezztrátově komprimovaný formát. Plná kvalita zvuku při zhruba 50–60 % velikosti souboru WAV. Oblíbený u audiofilů a v hudební produkci.
- Opus (.opus) – Moderní kodek s vynikající kvalitou při nízkých datových tocích. Standard pro VoIP a WebRTC – často používaný prohlížeči pro zvukové nahrávky.
- AIFF (.aiff, .aif) – Nekomprimovaný zvukový formát od Applu. Ekvivalent WAV ve světě macOS. Standard v hudební produkci na zařízeních Apple.
- WMA (.wma) – Windows Media Audio. Proprietární zvukový formát Microsoftu. Používaný staršími windowsovými diktafony a nahrávacími programy.
- AMR (.amr) – Adaptive Multi-Rate. Kompaktní řečový formát používaný mnoha mobilními telefony pro hlasové nahrávky. Nízký datový tok, ale optimalizovaný pro řeč.
- AC3 (.ac3) – Dolby Digital. Prostorový formát často používaný na DVD, Blu-ray a v televizních nahrávkách. scryp kanály automaticky extrahuje a smíchá do mona.
- DTS (.dts) – Digital Theater Systems. Vysoce kvalitní prostorový formát z kin a domácích kin. Automaticky se převede do formátu optimalizovaného pro rozpoznávání řeči.
- WebM Audio (.webm) – Kontejnerový formát pro webový zvuk. Standard pro nahrávky z prohlížeče, například přes vestavěnou funkci nahrávání ve scryp.
Dalších 38 podporovaných zvukových formátů:
Kontejnery a web: WebM Audio (.webm), CAF (.caf) – Core Audio Format, MKA (.mka) – Matroska Audio, MP2 (.mp2), SPX (.spx) – Speex, 3GP (.3gp).
Bezztrátové a audiofilní: APE (.ape) – Monkey's Audio, WavPack (.wv), TTA (.tta) – True Audio, TAK (.tak), Shorten (.shn), DSF (.dsf) – DSD Stream File, Musepack (.mpc).
Prostorové a kino: EAC3 (.eac3) – Dolby Digital Plus, DTS-HD (.dtshd), TrueHD (.thd) – Dolby TrueHD, MLP (.mlp).
Telefonie a VoIP: GSM (.gsm), iLBC (.lbc), QCP (.qcp), SBC (.sbc) – Bluetooth Audio, G.722 (.g722), G.723 (.g723), G.726 (.g726), G.729 (.g729).
Diktafony: DSS (.dss) – Digital Speech Standard (Olympus, Philips), ACT (.act) – ACT Voice.
Archiv a starší: AU (.au) – Sun/Unix Audio, W64 (.w64) – Sony Wave64, VOC (.voc) – Creative Voice, OMA (.oma) – Sony OpenMG, PVF (.pvf) – Portable Voice Format, SOX (.sox) – Sound eXchange, VQF (.vqf) – TwinVQ, MMF (.mmf) – Yamaha SMAF, IRCAM (.sf) – Berkeley/IRCAM, AVR (.avr) – Audio Visual Research, SLN (.sln) – Asterisk PCM.
Podporované video formáty (50+)
scryp přepisuje i video soubory přímo – zvuková stopa se extrahuje automaticky. Nemusíte zvuk předem ručně oddělovat:
- MP4 (.mp4) – Univerzální video standard. Produkovaný prakticky všemi kamerami, chytrými telefony a nástroji pro videokonference (Zoom, Teams, Google Meet).
- MOV (.mov) – Formát QuickTime od Applu. Standard pro videa z iPhonu a záznamy obrazovky na macOS.
- MKV (.mkv) – Kontejner Matroska. Flexibilní open-source formát, který podporuje více zvukových a titulkových stop. Běžný pro screencasty a video archivy.
- AVI (.avi) – Klasický windowsový video formát. Používaný staršími kamerami a windowsovými aplikacemi. Velké soubory, ale univerzálně kompatibilní.
- WebM (.webm) – Otevřený webový video formát od Googlu. Standard pro video nahrávky v prohlížeči a stahování z YouTube.
- MPEG / MPG (.mpeg, .mpg) – Klasický video formát. Standard pro DVD a starší video archivy.
- WMV (.wmv) – Windows Media Video. Video formát Microsoftu, občas k nalezení ve školicích videích a starších nahrávkách konferencí.
- FLV (.flv) – Flash Video. Pochází z éry Flashe, stále jej lze najít ve starších video archivech.
- M4V (.m4v) – Video varianta MP4 od Applu. Používaná iTunes a Apple TV.
- TS / MTS (.ts, .mts) – MPEG Transport Stream. Standard pro kamery (AVCHD) a televizní nahrávky.
- 3GP / 3G2 (.3gp, .3g2) – Mobilní video formáty. Produkované staršími chytrými telefony a tablety pro video nahrávky.
- VOB (.vob) – DVD Video Object. Formát souborů na DVD discích. Relevantní pro digitalizaci DVD archivů.
Dalších 44 podporovaných video formátů:
Profesionální a broadcast: MXF (.mxf) – Material eXchange Format, GXF (.gxf) – General eXchange Format, DV (.dv) – Digital Video, R3D (.r3d) – RED Raw, LXF (.lxf) – VR Native Stream, Y4M (.y4m) – YUV4MPEG, MLV (.mlv) – Magic Lantern Video, MJ2 (.mj2) – Motion JPEG 2000, IVF (.ivf).
Web a streaming: OGV (.ogv) – Ogg Video, ASF (.asf) – Advanced Streaming Format, F4V (.f4v) – Flash MP4, SWF (.swf) – ShockWave Flash, NSV (.nsv) – Nullsoft Streaming Video, ISM/ISMV (.ism, .ismv) – Smooth Streaming.
Televizní nahrávky a sledování: WTV (.wtv) – Windows Television, TY (.ty) – TiVo, DAV (.dav) – CCTV DVR, EVO (.evo) – HD-DVD.
Archiv a starší: RM/RMVB (.rm, .rmvb) – RealMedia, NUT (.nut), NUV (.nuv) – NuppelVideo, DivX (.divx), FLC/FLI (.flc, .fli) – Autodesk Animator, PSP (.psp), CDXL (.cdxl) – Amiga CDXL.
Hry a multimédia: BIK (.bik) – Bink Video, SMK (.smk) – Smacker, ROQ (.roq) – id Software, THP (.thp) – Nintendo, VMD (.vmd) – Sierra, VIV (.viv) – Vividas, XMV (.xmv) – Microsoft XMV, PMP (.pmp) – PSP Media, CPK (.cpk) – Sega FILM, RL2 (.rl2), RPL (.rpl), MTV (.mtv), PDV (.pdv) – PlayDate, IV8 (.iv8) – IndigoVision, BMV (.bmv) – Discworld, TMV (.tmv), YOP (.yop) – Psygnosis, WC3 (.wc3) – Wing Commander.
Jak funguje automatický převod
Celý proces převodu probíhá zcela automaticky na serveru. Bez ohledu na zdrojový formát se každý soubor zpracovává ve třech krocích: extrakce zvukové stopy, převod na 16kHz mono WAV pro rozpoznávání AI a následný přepis naším jazykovým modelem SX-3.
Technický postup:
- 1. Nahrání: Váš soubor je zašifrován v prohlížeči a nahrán ve vašem původním formátu.
- 2. Extrakce: Náš převodní engine extrahuje zvukovou stopu. U čistě zvukových souborů se tento krok přeskočí. U videí se použije pouze zvuk – obrazový materiál se neukládá.
- 3. Normalizace: Zvuk se převede do standardizovaného formátu WAV: vzorkovací frekvence 16 kHz, 16bitové PCM, mono. Tyto parametry jsou optimální pro náš model rozpoznávání řeči SX-3.
- 4. Přepis: Normalizovaný zvuk zpracuje SX-3. Souběžně probíhá diarizace mluvčích, které rozlišuje jednotlivé hlasy.
- 5. Verze pro přehrávání: Navíc se vytvoří komprimovaná verze MP3 pro přehrávání v prohlížeči, takže můžete při korektuře přímo poslouchat.
Tipy pro optimální kvalitu přepisu
scryp přijímá téměř jakýkoli formát – ale kvalita výsledku silně závisí na kvalitě nahrávky. Několik doporučení:
- Upřednostňujte nekomprimované formáty: WAV a FLAC přinášejí nejlepší výsledky, protože žádné kompresní artefakty neruší rozpoznávání řeči. Pokud místo na úložišti není problém, nahrávejte ve WAV.
- Vysoký datový tok u komprimovaných formátů: U MP3 by datový tok měl být alespoň 128 kb/s, lépe 192 nebo 256 kb/s. Soubory MP3 při 64 kb/s a méně mohou znatelně zhoršit přesnost rozpoznávání.
- Nahrávejte videa přímo: Nemusíte zvukovou stopu extrahovat ručně. Nahrajte video soubor přímo – scryp se o extrakci postará automaticky. To ušetří krok a zabrání ztrátě kvality z dvojího převodu.
- Prostorové formáty fungují: Vícekanálové formáty jako AC3 (Dolby Digital) a DTS se automaticky smíchají do mona. Zvuk nemusíte převádět ručně.
- Mějte na paměti prostředí nahrávání: Bez ohledu na formát: tichá místnost a dobrý mikrofon mají na přesnost přepisu větší vliv než volba mezi MP3 a WAV.
Časté dotazy
Musím soubory předem převádět? Ne. Nahrajte soubor v jeho původním formátu. Převod probíhá automaticky na serveru.
Co když můj formát není v seznamu? Prostě to zkuste. scryp přijímá jakýkoli soubor se zvukovým nebo video MIME typem. Zde uvedené formáty jsou ty nejběžnější – v praxi náš engine zvládá podstatně více.
Fungují i velmi velké video soubory? Ano. V závislosti na vašem plánu předplatného lze nahrát soubory až do 1 GB (Nano), 5 GB (Pro) nebo 10 GB (Ultra). U velkých souborů se používá vícedílné nahrávání, které spolehlivě funguje i při nestabilním připojení.
Co zvukové stopy v cizích jazycích? Formát souboru je nezávislý na jazyce. scryp automaticky rozpoznává přes 90 jazyků. Pokud chcete rozpoznávání urychlit, můžete při nahrávání zadat nápovědu k jazyku.
Jsou mé soubory po přepisu smazány? Ano. Zašifrované původní soubory se po zpracování automaticky smažou. Na serveru zůstane pouze zašifrovaná verze pro přehrávání (MP3) a zašifrovaný přepis.
Závěr
scryp podporuje přes 100 zvukových a video formátů – od běžných standardů jako MP3 a MP4, přes profesionální prostorové formáty jako AC3 a DTS, až po specializované archivní formáty jako VOB, MXF nebo MTS. Náš převodní engine se postará o kodeky a kompatibilitu formátů. Jednoduše nahrajte svůj soubor v jeho původním formátu a o zbytek se postará automatika. Pro co nejlepší kvalitu přepisu se doporučuje nekomprimovaný formát nebo formát s vysokým datovým tokem – a, což je důležitější, dobré prostředí nahrávání.