Transkripsiyon karşılaştırması
scryp Türkçe transkripsiyonda ne kadar doğru – ve verileriniz büyük bulut hizmetlerine kıyasla ne kadar güvende? İşte kıyaslama sonuçlarımız.
Türkçe için transkripsiyon doğruluğu
Kelime Hata Oranı (WER) – düşük olan daha iyidir. Doğruluk = %100 − WER.
← Tabloyu yana kaydırın →
| Sağlayıcı | Genel (doğruluk) | Uzmanlaşmış alan (doğruluk) | Genel WER |
|---|---|---|---|
| scrypSX-3 | 97.2 % | 96.1 % | 2.8 % |
| OpenAIWhisper Large v3 | 91.8 % | 83.5 % | 8.2 % |
| Google STTCloud Speech-to-Text | 88.5 % | 80.2 % | 11.5 % |
| Azure SpeechMicrosoft Cognitive | 87.9 % | 78.7 % | 12.1 % |
| AWS TranscribeAmazon Standard | 85.7 % | 75.9 % | 14.3 % |
Test veri seti ve metodoloji
- Temel aldığımız veri seti; Genel, Sağlık ve Hukuk alanlarında halka açık Türkçe ses kayıtlarından oluşturduğumuz kendi test veri setimizdir.
- Tüm sağlayıcılar aynı ses dosyaları ve tek tip bir değerlendirme yöntemi (standart normalleştirmeden sonra Kelime Hata Oranı) ile test edildi.
- Uzmanlaşmış alan sütunu, sağlık ve yasal kayıtlardaki ortalamayı gösterir. Tüm sağlayıcılar için uzmanlaşmış kelime dağarcığıyla hata oranları artar – ancak alana özgü eğitimi olmayan modeller için çok daha fazla.
- Sonuçlar ses kalitesine, konuşmacı sayısına, şiveye ve belirli kullanım durumuna bağlı olarak değişebilir.
Hassas içerikler için scryp neden farklı şekilde tasarlanmıştır?
Bu noktalar scryp'in kendi mimarisini açıklar. Bilinçli olarak somut ifade edilmiştir ve diğer tüm sağlayıcılar hakkında genel bir yargı değildir.
Cihazınızda şifreleme
Dosyalar yüklenmeden önce tarayıcıda şifrelenir. Saklanan içerikler her zaman yalnızca şifreli olarak tutulur.
Açık AB mimarisi
Avusturya'da transkripsiyon, Almanya'da şifreli depolama – her ikisi de AB içinde. Bu, her işleme adımının nerede gerçekleştiğini şeffaf hale getirir.
Kendi işleme altyapımız
Transkripsiyona harici üçüncü taraf yapay zekâ dahil değildir. Bu, ek veri akışlarını ve bağımlılıkları azaltır.
Tam tarayıcı iş akışı
Düzenleme, dışa aktarma, paylaşım ve ses senkronizasyonu ürüne doğrudan entegredir; yalnızca ayrı API bileşenleri olarak sunulmaz.
Kaynaklar ve dokümantasyon
Sağlayıcı özellikleri resmi belgelere göre doğrulanmıştır. Doğruluk rakamları yukarıda açıklanan test veri setine dayanmaktadır.
Modeller ve doğruluk
- Radford et al. (2022): Robust Speech Recognition via Large-Scale Weak Supervision - OpenAI Whisper Paper
- OpenAI Whisper Repository - Modelle und Sprachen
- faster-whisper (SYSTRAN) - CTranslate2-basierte Whisper-Implementierung
- pyannote.audio 3.x - Speaker Diarization Pipeline
- Mozilla Common Voice - Offener Sprachdatensatz
Sağlayıcı dokümantasyonu
- Google Cloud Speech-to-Text - Overview and speech recognition
- Google Cloud Speech-to-Text - Speaker Diarization
- Microsoft Azure Speech Service - Overview and documentation
- Azure Speech - Real-time diarization quickstart
- Amazon Transcribe - Developer Guide
- Amazon Transcribe - Speaker partitioning (Diarization)
Güvenli transkripsiyona hazır mısınız?
scryp'i ücretsiz deneyin – ilk saniyeden itibaren şifrelenmiş.