Ë
    ;“iç  ã                   óš   — U d Z ddlZddlmZ ddlZddlmZmZmZm	Z	m
Z
mZmZ ddlmZ  G d„ d«      Zd	ed
efd„Zdaee   ed<   d
efd„Zy)zr
Whisper Speech-to-Text Module

Provides transcription using OpenAI's Whisper model with hallucination detection.
é    N)ÚOptionalé   )ÚWHISPER_MODEL_NAMEÚWHISPER_LANGUAGEÚWHISPER_FP16ÚSAMPLE_RATE_OUTÚBYTES_PER_SAMPLEÚlog_sttÚlog_call)Úsave_wavc                   ó^   — e Zd ZdZeeefdededefd„Z	d„ Z
ed„ «       Zded	efd
„Zd	efd„Zy)ÚWhisperTranscriberzs
    Whisper-based speech transcription.

    Handles model loading, transcription, and prompt leak detection.
    Ú
model_nameÚlanguageÚfp16c                 ó<   — || _         || _        || _        d| _        y)zû
        Initialize Whisper transcriber.

        Args:
            model_name: Whisper model size (tiny, base, small, medium, large)
            language: Target language code (e.g., 'en')
            fp16: Use FP16 inference (requires CUDA)
        N©r   r   r   Ú_model)Úselfr   r   r   s       ú-/home/sas/my/fyp/ringai/ringai/stt/whisper.pyÚ__init__zWhisperTranscriber.__init__   s    € ð %ˆŒØ ˆŒØˆŒ	Øˆó    c                 óÐ   — | j                   €Zt        j                  d| j                  «       t	        j
                  | j                  «      | _         t        j                  d«       yy)zLoad Whisper model into memoryNzLoading Whisper model=%sz!Whisper model loaded successfully)r   r   Úinfor   ÚwhisperÚ
load_model©r   s    r   r   zWhisperTranscriber.load_model2   sG   € à;‰;ÐÜM‰MÐ4°d·o±oÔFÜ!×,Ñ,¨T¯_©_Ó=ˆDŒKÜM‰MÐ=Õ>ð r   c                 óR   — | j                   €| j                  «        | j                   S )z&Get loaded model, loading if necessary)r   r   r   s    r   ÚmodelzWhisperTranscriber.model9   s"   € ð ;‰;ÐØO‰OÔØ{‰{Ðr   Úpcm_16kÚreturnc                 óP  — t        t        t        z  dz  «      }|rt        |«      |k  ry	 t	        j
                  dd¬«      5 }t        ||j                  t        «       | j                  j                  |j                  | j                  | j                  dddddd	d
¬«
      }ddd«       j                  d«      xs dj                  «       }t        |«      rt        j                   d«       y|S # 1 sw Y   ŒOxY w# t"        $ r }t        j$                  d|«       Y d}~yd}~ww xY w)zÀ
        Transcribe 16kHz PCM audio to text.

        Args:
            pcm_16k: 16kHz 16-bit PCM audio data

        Returns:
            Transcribed text, or empty string on failure
        g      Ð?Ú z.wavT)ÚsuffixÚdeleteFg        é   g333333ã?g      ð¿)	r   r   ÚverboseÚcondition_on_previous_textÚinitial_promptÚtemperatureÚ	beam_sizeÚno_speech_thresholdÚlogprob_thresholdNÚtextzDropped prompt-leak utterancezWhisper failed: %r)Úintr   r	   ÚlenÚtempfileÚNamedTemporaryFiler   Únamer   Ú
transcriber   r   ÚgetÚstripÚis_prompt_leakr
   ÚwarningÚRuntimeErrorÚerror)r   r    Ú	min_bytesÚtmpÚresultr.   Úes          r   r4   zWhisperTranscriber.transcribe@   s	  € ô œÔ*:Ñ:¸TÑAÓBˆ	Ùœ#˜g›,¨Ò2Øð	Ü×,Ñ,°FÀ4ÔHð ÈCÜ˜ #§(¡(¬OÔ<àŸ™×.Ñ.Ø—H‘HØ!Ÿ]™]ØŸ™Ø!Ø/4Ø#%Ø #ØØ(+Ø&*ð /ó ÷ð  —J‘J˜vÓ&Ò,¨"×3Ñ3Ó5ˆDô ˜dÔ#Ü—‘Ð ?Ô@ØàˆK÷/ð ûô2 ò 	ÜM‰MÐ.°Ô2Üûð	ús7   ¬C< ÁAC0Â"AC< Ã.C< Ã0C9Ã5C< Ã<	D%ÄD Ä D%c                 ód   — | j                   | j                  | j                  | j                  dudœS )z"Get information about loaded modelN)r   r   r   Úloadedr   r   s    r   Úget_model_infoz!WhisperTranscriber.get_model_infom   s/   € ð Ÿ/™/ØŸ™Ø—I‘IØ—k‘k¨Ð-ñ	
ð 	
r   N)Ú__name__Ú
__module__Ú__qualname__Ú__doc__r   r   r   ÚstrÚboolr   r   Úpropertyr   Úbytesr4   ÚdictrA   © r   r   r   r      sl   „ ñð -Ø(Ø!ñ	àðð ðð ó	ò&?ð ñó ðð+ %ð +¨Có +ðZ
 ô 
r   r   r.   r!   c                 ó~   ‡— | j                  «       Šd‰v rd‰v ryt        ‰«      dkD  rt        ˆfd„dD «       «      ryy)a+  
    Detect when Whisper hallucinates its own prompt instead of transcribing real speech.

    This is a conservative check - only drops obvious prompt leaks, not real user speech.

    Args:
        text: Transcribed text to check

    Returns:
        True if text appears to be a prompt leak
    zcustomer support phone callz"technical or service-related issueTé–   c              3   ó&   •K  — | ]  }|‰v –— Œ
 y ­w)NrK   )Ú.0ÚkÚts     €r   ú	<genexpr>z!is_prompt_leak.<locals>.<genexpr>Š   s   øè ø€ Ò\ q˜A œFÑ\ùs   ƒ)ÚcustomerÚsupportÚ	technicalÚserviceF)Úlowerr0   Úall)r.   rQ   s    @r   r7   r7   w   sG   ø€ ð 	
‰
‹€Að %¨Ñ)Ð.RÐVWÑ.WØô ˆ1ƒv‚|œÓ\Ð,[Ô\Ô\Øàr   Ú_transcriberc                  ó.   — t         €
t        «       a t         S )zGet global transcriber instance)rY   r   rK   r   r   Úget_transcriberr[   ”   s   € ô ÐÜ)Ó+ˆÜÐr   )rE   r1   Útypingr   r   Úconfigr   r   r   r   r	   r
   r   Úaudio.processingr   r   rF   rG   r7   rY   Ú__annotations__r[   rK   r   r   ú<module>r`      sh   ðòó Ý ã ÷÷ ñ õ (÷\
ñ \
ð~˜ð  ó ð4 .2€ˆhÐ)Ñ*Ó 1ðÐ+ô r   