Desteklenen Dosya Biçimleri: Hangi Ses ve Video Dosyalarını Metne Dönüştürebilirsiniz
İlk yüklemeden önce en sık sorulan sorulardan biri: “Dosya biçimim destekleniyor mu?” Kısa yanıt: Çok büyük olasılıkla evet. scryp 50’den fazla ses biçimini ve 50’den fazla video biçimini kabul eder – MP3 ve MP4 gibi yaygın standartlardan FLAC, AC3 veya MKV gibi profesyonel biçimlere kadar. Bu makale, desteklenen tüm biçimleri listeler, otomatik dönüştürmenin nasıl çalıştığını ve kayıt kalitesinde nelere dikkat etmeniz gerektiğini açıklar.
Neden bu kadar çok biçim? scryp’in dönüştürme motoru
scryp, pratikte yaygın her ses ve video biçimini işleyebilen kendi dönüştürme motoruna sahiptir. Yüklenen her dosya, kaynak biçiminden bağımsız olarak transkripsiyondan önce otomatik olarak optimize edilmiş bir biçime dönüştürülür.
Ayrıntılı akış: Desteklenen herhangi bir biçimde bir dosya yüklersiniz. Motorumuz ses izini otomatik olarak çıkarır (videolarda görüntü izi atılır) ve bunu 16 kHz örnekleme hızında, tek kanallı (mono) standart bir WAV biçimine dönüştürür. Bu biçim, yapay zekâ tabanlı ses tanıma için en uygunudur. Yani kodek, örnekleme hızı veya kanal sayısı hakkında hiç düşünmek zorunda kalmazsınız – bunların hepsi tam otomatik gerçekleşir.
Desteklenen ses biçimleri (50+)
Aşağıdaki liste, scryp’in doğrudan kabul ettiği en yaygın ses biçimlerini gösterir. Biçiminiz burada yer alıyorsa dosyayı herhangi bir hazırlık yapmadan yükleyebilirsiniz:
- MP3 (.mp3) – En yaygın ses biçimi. Sıkıştırılmış, dosya boyutu ile kalite arasında iyi bir denge sunar. Akıllı telefon ve dikte cihazı kayıtları için idealdir.
- WAV (.wav) – Tam ses kalitesine sahip sıkıştırılmamış biçim. Profesyonel ses prodüksiyonunda standarttır. Daha büyük dosyalar, ancak en iyi transkripsiyon doğruluğu.
- M4A / AAC (.m4a, .aac) – Apple’ın standart ses biçimi. iPhone, iPad ve macOS tarafından kullanılır. Aynı dosya boyutunda MP3’ten daha iyi kalite.
- OGG / Vorbis (.ogg, .oga) – İyi sıkıştırmaya sahip açık kaynaklı biçim. Linux sistemlerinde ve web uygulamalarında yaygındır.
- FLAC (.flac) – Kayıpsız sıkıştırılmış biçim. WAV dosya boyutunun yaklaşık %50–60’ında tam ses kalitesi. Audiophile’lar arasında ve müzik prodüksiyonunda popülerdir.
- Opus (.opus) – Düşük bit hızlarında olağanüstü kaliteye sahip modern kodek. VoIP ve WebRTC için standarttır – ses kayıtlarında tarayıcılar tarafından sıkça kullanılır.
- AIFF (.aiff, .aif) – Apple’ın sıkıştırılmamış ses biçimi. macOS dünyasında WAV’ın karşılığıdır. Apple cihazlarındaki müzik prodüksiyonunda standarttır.
- WMA (.wma) – Windows Media Audio. Microsoft’un tescilli ses biçimi. Eski Windows dikte cihazları ve kayıt programları tarafından kullanılır.
- AMR (.amr) – Adaptive Multi-Rate. Birçok cep telefonunun ses kayıtları için kullandığı, kompakt bir konuşma biçimi. Düşük bit hızı, ancak konuşma için optimize edilmiştir.
- AC3 (.ac3) – Dolby Digital. DVD’ler, Blu-ray’ler ve TV kayıtlarında sıkça kullanılan surround ses biçimi. scryp kanalları otomatik olarak çıkarır ve mono’ya karıştırır.
- DTS (.dts) – Digital Theater Systems. Sinema ve ev sineması alanından gelen yüksek kaliteli surround biçimi. Ses tanıma için optimize edilmiş bir biçime otomatik olarak dönüştürülür.
- WebM Audio (.webm) – Web sesi için kapsayıcı biçim. Tarayıcı kayıtlarında, örneğin scryp’in tümleşik kayıt işleviyle, standarttır.
Desteklenen 38 ek ses biçimi daha:
Kapsayıcı & Web: WebM Audio (.webm), CAF (.caf) – Core Audio Format, MKA (.mka) – Matroska Audio, MP2 (.mp2), SPX (.spx) – Speex, 3GP (.3gp).
Kayıpsız & Audiophile: APE (.ape) – Monkey's Audio, WavPack (.wv), TTA (.tta) – True Audio, TAK (.tak), Shorten (.shn), DSF (.dsf) – DSD Stream File, Musepack (.mpc).
Surround & Sinema: EAC3 (.eac3) – Dolby Digital Plus, DTS-HD (.dtshd), TrueHD (.thd) – Dolby TrueHD, MLP (.mlp).
Telefon & VoIP: GSM (.gsm), iLBC (.lbc), QCP (.qcp), SBC (.sbc) – Bluetooth Audio, G.722 (.g722), G.723 (.g723), G.726 (.g726), G.729 (.g729).
Dikte cihazları: DSS (.dss) – Digital Speech Standard (Olympus, Philips), ACT (.act) – ACT Voice.
Arşiv & Eski biçimler: AU (.au) – Sun/Unix Audio, W64 (.w64) – Sony Wave64, VOC (.voc) – Creative Voice, OMA (.oma) – Sony OpenMG, PVF (.pvf) – Portable Voice Format, SOX (.sox) – Sound eXchange, VQF (.vqf) – TwinVQ, MMF (.mmf) – Yamaha SMAF, IRCAM (.sf) – Berkeley/IRCAM, AVR (.avr) – Audio Visual Research, SLN (.sln) – Asterisk PCM.
Desteklenen video biçimleri (50+)
scryp video dosyalarını da doğrudan transkribe eder – ses izi otomatik olarak çıkarılır. Sesi önceden elle ayırmanız gerekmez:
- MP4 (.mp4) – Evrensel video standardı. Pratikte tüm kameralar, akıllı telefonlar ve video konferans araçları (Zoom, Teams, Google Meet) tarafından üretilir.
- MOV (.mov) – Apple’ın QuickTime biçimi. iPhone videolarında ve macOS ekran kayıtlarında standarttır.
- MKV (.mkv) – Matroska kapsayıcısı. Birden çok ses ve altyazı izini destekleyen esnek, açık kaynaklı biçim. Ekran kayıtlarında ve video arşivlemelerinde yaygındır.
- AVI (.avi) – Klasik Windows video biçimi. Eski kameralar ve Windows uygulamaları tarafından kullanılır. Büyük dosyalar, ancak evrensel olarak uyumlu.
- WebM (.webm) – Google’ın açık web video biçimi. Tarayıcı tabanlı video kayıtlarında ve YouTube indirmelerinde standarttır.
- MPEG / MPG (.mpeg, .mpg) – Klasik video biçimi. DVD’ler ve eski video arşivleri için standarttır.
- WMV (.wmv) – Windows Media Video. Microsoft’un video biçimi; zaman zaman eğitim videolarında ve eski konferans kayıtlarında karşılaşılır.
- FLV (.flv) – Flash Video. Flash döneminden kalır ve hâlâ eski video arşivlerinde bulunur.
- M4V (.m4v) – Apple’ın MP4 video çeşidi. iTunes ve Apple TV tarafından kullanılır.
- TS / MTS (.ts, .mts) – MPEG Transport Stream. Video kameralarda (AVCHD) ve TV kayıtlarında standarttır.
- 3GP / 3G2 (.3gp, .3g2) – Mobil video biçimleri. Eski akıllı telefonlar ve tabletler tarafından video kayıtlarında üretilir.
- VOB (.vob) – DVD Video Object. DVD disklerindeki dosya biçimi. DVD arşivlerinin dijitalleştirilmesi için önemlidir.
Desteklenen 44 ek video biçimi daha:
Profesyonel & Yayıncılık: MXF (.mxf) – Material eXchange Format, GXF (.gxf) – General eXchange Format, DV (.dv) – Digital Video, R3D (.r3d) – RED Raw, LXF (.lxf) – VR Native Stream, Y4M (.y4m) – YUV4MPEG, MLV (.mlv) – Magic Lantern Video, MJ2 (.mj2) – Motion JPEG 2000, IVF (.ivf).
Web & Akış: OGV (.ogv) – Ogg Video, ASF (.asf) – Advanced Streaming Format, F4V (.f4v) – Flash MP4, SWF (.swf) – ShockWave Flash, NSV (.nsv) – Nullsoft Streaming Video, ISM/ISMV (.ism, .ismv) – Smooth Streaming.
TV kayıtları & Gözetim: WTV (.wtv) – Windows Television, TY (.ty) – TiVo, DAV (.dav) – CCTV DVR, EVO (.evo) – HD-DVD.
Arşiv & Eski biçimler: RM/RMVB (.rm, .rmvb) – RealMedia, NUT (.nut), NUV (.nuv) – NuppelVideo, DivX (.divx), FLC/FLI (.flc, .fli) – Autodesk Animator, PSP (.psp), CDXL (.cdxl) – Amiga CDXL.
Oyun & Multimedya: BIK (.bik) – Bink Video, SMK (.smk) – Smacker, ROQ (.roq) – id Software, THP (.thp) – Nintendo, VMD (.vmd) – Sierra, VIV (.viv) – Vividas, XMV (.xmv) – Microsoft XMV, PMP (.pmp) – PSP Media, CPK (.cpk) – Sega FILM, RL2 (.rl2), RPL (.rpl), MTV (.mtv), PDV (.pdv) – PlayDate, IV8 (.iv8) – IndigoVision, BMV (.bmv) – Discworld, TMV (.tmv), YOP (.yop) – Psygnosis, WC3 (.wc3) – Wing Commander.
Otomatik dönüştürme nasıl çalışır
Dönüştürme sürecinin tamamı sunucuda tam otomatik çalışır. Kaynak biçiminden bağımsız olarak her dosya üç adımda işlenir: ses izinin çıkarılması, yapay zekâ tanıması için 16 kHz mono WAV’a dönüştürme ve ardından SX-3 dil modelimizle transkripsiyon.
Teknik akış:
- 1. Yükleme: Dosyanız tarayıcıda şifrelenir ve özgün biçiminde yüklenir.
- 2. Çıkarma: Dönüştürme motorumuz ses izini çıkarır. Yalnızca ses içeren dosyalarda bu adım atlanır. Videolarda yalnızca ses kullanılır – görüntü materyali saklanmaz.
- 3. Normalleştirme: Ses, standart bir WAV biçimine dönüştürülür: 16 kHz örnekleme hızı, 16-bit PCM, mono. Bu parametreler ses tanıma modelimiz SX-3 için en uygundur.
- 4. Transkripsiyon: Normalleştirilmiş ses SX-3 tarafından işlenir. Aynı anda, farklı sesleri ayırt eden konuşmacı ayrımı (diarization) gerçekleşir.
- 5. Oynatma sürümü: Ek olarak, tarayıcıda oynatmak için sıkıştırılmış bir MP3 sürümü oluşturulur; böylece düzeltme okuması sırasında sesi doğrudan dinleyebilirsiniz.
En iyi transkripsiyon kalitesi için ipuçları
scryp neredeyse her biçimi kabul eder – ancak sonucun kalitesi büyük ölçüde kaydın kalitesine bağlıdır. Birkaç öneri:
- Sıkıştırılmamış biçimleri tercih edin: WAV ve FLAC en iyi sonuçları verir, çünkü hiçbir sıkıştırma artefaktı ses tanımayı bozmaz. Depolama alanı sorun değilse WAV olarak kaydedin.
- Sıkıştırılmış biçimlerde yüksek bit hızı: MP3’te bit hızı en az 128 kbps, tercihen 192 ya da 256 kbps olmalıdır. 64 kbps veya daha düşük MP3 dosyaları, tanıma doğruluğunu hissedilir biçimde kötüleştirebilir.
- Videoları doğrudan yükleyin: Ses izini elle çıkarmanız gerekmez. Video dosyasını doğrudan yükleyin – scryp çıkarmayı otomatik olarak gerçekleştirir. Bu, bir iş adımını ortadan kaldırır ve çift dönüştürmeden kaynaklı kalite kaybını önler.
- Surround biçimleri çalışır: AC3 (Dolby Digital) ve DTS gibi çok kanallı biçimler otomatik olarak mono’ya karıştırılır. Sesi elle dönüştürmeniz gerekmez.
- Kayıt ortamına dikkat edin: Biçimden bağımsız olarak: Sessiz bir oda ve iyi bir mikrofon, transkripsiyon doğruluğuna MP3 ile WAV arasındaki seçimden daha fazla etki eder.
Sık sorulan sorular
Dosyalarımı önceden dönüştürmem gerekir mi? Hayır. Dosyayı özgün biçiminde yükleyin. Dönüştürme sunucuda otomatik olarak gerçekleşir.
Biçimim listede yoksa ne olur? Yalnızca deneyin. scryp, ses veya video MIME türüne sahip her dosyayı kabul eder. Burada listelenen biçimler en yaygın olanlardır – motorumuz pratikte çok daha fazlasını işler.
Çok büyük video dosyaları da çalışır mı? Evet. Abonelik planınıza göre 1 GB’a (Nano), 5 GB’a (Pro) veya 10 GB’a (Ultra) kadar dosyalar yüklenebilir. Büyük dosyalarda, kararsız bağlantıda dahi güvenilir biçimde çalışan çok parçalı bir yükleme kullanılır.
Yabancı dildeki ses izleri ne olacak? Dosya biçimi dilden bağımsızdır. scryp 90’dan fazla dili otomatik olarak tanır. Tanımayı hızlandırmak isterseniz, yükleme sırasında bir dil ipucu verebilirsiniz.
Dosyalarım transkripsiyondan sonra silinir mi? Evet. Şifrelenmiş özgün dosyalar işlemeden sonra otomatik olarak silinir. Sunucuda yalnızca şifrelenmiş bir oynatma sürümü (MP3) ve şifrelenmiş transkript kalır.
Sonuç
scryp, 100’den fazla ses ve video biçimini destekler – MP3 ve MP4 gibi günlük standartlardan AC3 ve DTS gibi profesyonel surround biçimlerine, VOB, MXF veya MTS gibi özel arşiv biçimlerine kadar. Dönüştürme motorumuz kodekler ve biçim uyumluluğuyla ilgilenir. Dosyanızı yalnızca özgün biçiminde yükleyin, gerisi otomatik olarak gerçekleşir. En iyi transkripsiyon kalitesi için sıkıştırılmamış veya yüksek bit hızlı bir biçim ve – daha da önemlisi – iyi bir kayıt ortamı önerilir.