AISDK-229: Add skip_postprocessing option (#97)

Kyle Bridburg · web-flow · commit f6d93c4600dc · 2022-07-25T09:22:40.000-07:00
diff --git a/examples/async_example.py b/examples/async_example.py
@@ -46,7 +46,8 @@
 #                                    delete_after_seconds=None,
 #                                    language=None,
 #                                    custom_vocabulary_id=None,
-#                                    notification_config=None)
+#                                    notification_config=None,
+#                                    skip_postprocessing=False)
 
 
 # Submitting a job with a link to the file you want transcribed
@@ -63,7 +64,8 @@
                             language=None,
                             custom_vocabulary_id=None,
                             source_config=None,
-                            notification_config=None)
+                            notification_config=None,
+                            skip_postprocessing=False)
 
 print("Submitted Job")
 
diff --git a/src/rev_ai/__init__.py b/src/rev_ai/__init__.py
@@ -1,7 +1,7 @@
 # -*- coding: utf-8 -*-
 """Top-level package for rev_ai"""
 
-__version__ = '2.17.0'
+__version__ = '2.17.1'
 
 from .models import Job, JobStatus, Account, Transcript, Monologue, Element, MediaConfig, \
     CaptionType, CustomVocabulary, TopicExtractionJob, TopicExtractionResult, Topic, Informant, \
diff --git a/src/rev_ai/apiclient.py b/src/rev_ai/apiclient.py
@@ -63,7 +63,8 @@ def submit_job_url(
             segments_to_transcribe=None,
             speaker_names=None,
             source_config=None,
-            notification_config=None):
+            notification_config=None,
+            skip_postprocessing=False):
         """Submit media given a URL for transcription.
         The audio data is downloaded from the URL
         :param media_url: web location of the media file
@@ -109,6 +110,7 @@ def submit_job_url(
         :param notification_config: CustomerUrlData object containing the callback url to
             invoke on job completion as a webhook and optional authentication headers to use when
             calling the callback url
+        :param skip_postprocessing: skip all text postprocessing (punctuation, capitalization, ITN)
         :returns: raw response data
         :raises: HTTPError
         """
@@ -120,7 +122,8 @@ def submit_job_url(
                                                    language, custom_vocabulary_id, transcriber,
                                                    verbatim, rush, test_mode,
                                                    segments_to_transcribe, speaker_names,
-                                                   source_config, notification_config)
+                                                   source_config, notification_config,
+                                                   skip_postprocessing)
 
         response = self._make_http_request(
             "POST",
@@ -150,7 +153,8 @@ def submit_job_local_file(
             test_mode=None,
             segments_to_transcribe=None,
             speaker_names=None,
-            notification_config=None):
+            notification_config=None,
+            skip_postprocessing=False):
         """Submit a local file for transcription.
         Note that the content type is inferred if not provided.
 
@@ -193,6 +197,7 @@ def submit_job_local_file(
         :param notification_config: CustomerUrlData object containing the callback url to
             invoke on job completion as a webhook and optional authentication headers to use when
             calling the callback url
+        :param skip_postprocessing: skip all text postprocessing (punctuation, capitalization, ITN)
         :returns: raw response data
         :raises: HTTPError, ValueError
         """
@@ -207,7 +212,7 @@ def submit_job_local_file(
                                                    language, custom_vocabulary_id, transcriber,
                                                    verbatim, rush, test_mode,
                                                    segments_to_transcribe, speaker_names, None,
-                                                   notification_config)
+                                                   notification_config, skip_postprocessing)
 
         with open(filename, 'rb') as f:
             files = {
@@ -457,7 +462,8 @@ def _create_job_options_payload(
             segments_to_transcribe=None,
             speaker_names=None,
             source_config=None,
-            notification_config=None):
+            notification_config=None,
+            skip_postprocessing=False):
         payload = {}
         if media_url:
             payload['media_url'] = media_url
@@ -500,6 +506,8 @@ def _create_job_options_payload(
             payload['source_config'] = source_config.to_dict()
         if notification_config:
             payload['notification_config'] = notification_config.to_dict()
+        if skip_postprocessing:
+            payload['skip_postprocessing'] = skip_postprocessing
         return payload
 
     def _create_captions_query(self, speaker_channel):
diff --git a/src/rev_ai/streamingclient.py b/src/rev_ai/streamingclient.py
@@ -25,7 +25,7 @@ def on_connected(job_id):
     print('Connected, Job ID : {}'.format(job_id))
 
 
-class RevAiStreamingClient():
+class RevAiStreamingClient:
     def __init__(self,
                  access_token,
                  config,
@@ -40,7 +40,7 @@ def __init__(self,
         :param config: a MediaConfig object containing audio information.
             See MediaConfig.py for more information
         :param version (optional): version of the streaming api to be used
-        :param on_error (optional): function to be called when recieving an
+        :param on_error (optional): function to be called when receiving an
             error from the server
         :param on_close (optional): function to be called when the websocket
             closes
@@ -72,7 +72,8 @@ def start(self,
               detailed_partials=None,
               start_ts=None,
               transcriber=None,
-              language=None):
+              language=None,
+              skip_postprocessing=None):
         """Function to connect the websocket to the URL and start the response
             thread
         :param generator: generator object that yields binary audio data
@@ -85,6 +86,7 @@ def start(self,
         :param start_ts: number of seconds to offset all hypotheses timings
         :param transcriber: type of transcriber to use to transcribe the media file
         :param language: language to use for the streaming job
+        :param skip_postprocessing: skip all text postprocessing on final hypotheses
         """
         url = self.base_url + '?' + urlencode({
             'access_token': self.access_token,
@@ -119,6 +121,9 @@ def start(self,
         if language:
             url += '&' + urlencode({'language': language})
 
+        if skip_postprocessing:
+            url += '&' + urlencode({'skip_postprocessing': 'true'})
+
         try:
             self.client.connect(url)
         except Exception as e:
@@ -153,7 +158,7 @@ def _start_send_data_thread(self, generator):
 
     def _send_data(self, generator):
         """Function used in a thread to send requests to the server.
-        :param generator: enerator object that yields binary audio data
+        :param generator: enumerator object that yields binary audio data
         """
         if not generator:
             raise ValueError('generator must be provided')
@@ -164,7 +169,7 @@ def _send_data(self, generator):
         self.client.send("EOS")
 
     def _get_response_generator(self):
-        """A generator of reponses from the server. Yields the data decoded.
+        """A generator of responses from the server. Yields the data decoded.
         """
         while True:
             with self.client.readlock:
diff --git a/tests/test_job.py b/tests/test_job.py
@@ -119,7 +119,8 @@ def test_submit_job_url_with_success(self, mock_session, make_mock_response):
             'remove_disfluencies': True,
             'delete_after_seconds': 0,
             'language': LANGUAGE,
-            'transcriber': TRANSCRIBER
+            'transcriber': TRANSCRIBER,
+            'skip_postprocessing': True
         }
         response = make_mock_response(url=JOB_ID_URL, json_data=data)
         mock_session.request.return_value = response
@@ -129,7 +130,7 @@ def test_submit_job_url_with_success(self, mock_session, make_mock_response):
                                     NOTIFICATION_URL, True,
                                     True, 1, CUSTOM_VOCAB, True,
                                     True, 0, LANGUAGE, CUSTOM_VOCAB_ID,
-                                    TRANSCRIBER)
+                                    TRANSCRIBER, skip_postprocessing=True)
 
         assert res == Job(JOB_ID,
                           CREATED_ON,
@@ -159,7 +160,8 @@ def test_submit_job_url_with_success(self, mock_session, make_mock_response):
                 'delete_after_seconds': 0,
                 'language': LANGUAGE,
                 'custom_vocabulary_id': CUSTOM_VOCAB_ID,
-                'transcriber': TRANSCRIBER
+                'transcriber': TRANSCRIBER,
+                'skip_postprocessing': True
             },
             headers=client.default_headers)
 
@@ -176,7 +178,8 @@ def test_submit_job_url_with_auth_options(self, mock_session, make_mock_response
             'remove_disfluencies': True,
             'delete_after_seconds': 0,
             'language': LANGUAGE,
-            'transcriber': TRANSCRIBER
+            'transcriber': TRANSCRIBER,
+            'skip_postprocessing': True
         }
         response = make_mock_response(url=JOB_ID_URL, json_data=data)
         mock_session.request.return_value = response
@@ -188,7 +191,8 @@ def test_submit_job_url_with_auth_options(self, mock_session, make_mock_response
                                     delete_after_seconds=0, language=LANGUAGE,
                                     custom_vocabulary_id=CUSTOM_VOCAB_ID, transcriber=TRANSCRIBER,
                                     source_config=SOURCE_CONFIG,
-                                    notification_config=NOTIFICATION_CONFIG)
+                                    notification_config=NOTIFICATION_CONFIG,
+                                    skip_postprocessing=True)
 
         assert res == Job(JOB_ID,
                           CREATED_ON,
@@ -218,7 +222,8 @@ def test_submit_job_url_with_auth_options(self, mock_session, make_mock_response
                 'delete_after_seconds': 0,
                 'language': LANGUAGE,
                 'custom_vocabulary_id': CUSTOM_VOCAB_ID,
-                'transcriber': TRANSCRIBER
+                'transcriber': TRANSCRIBER,
+                'skip_postprocessing': True
             },
             headers=client.default_headers)
 
@@ -277,7 +282,8 @@ def test_submit_job_local_file_with_success(self, mocker, mock_session, make_moc
             'remove_disfluencies': True,
             'delete_after_seconds': 0,
             'language': LANGUAGE,
-            'transcriber': TRANSCRIBER
+            'transcriber': TRANSCRIBER,
+            'skip_postprocessing': True
         }
         response = make_mock_response(url=JOB_ID_URL, json_data=data)
         mock_session.request.return_value = response
@@ -288,7 +294,7 @@ def test_submit_job_local_file_with_success(self, mocker, mock_session, make_moc
                                                NOTIFICATION_URL, True,
                                                True, 1, CUSTOM_VOCAB, True,
                                                True, 0, LANGUAGE, CUSTOM_VOCAB_ID,
-                                               TRANSCRIBER)
+                                               TRANSCRIBER, skip_postprocessing=True)
 
             assert res == Job(JOB_ID,
                               CREATED_ON,
@@ -322,7 +328,8 @@ def test_submit_job_local_file_with_success(self, mocker, mock_session, make_moc
                             'delete_after_seconds': 0,
                             'language': LANGUAGE,
                             'custom_vocabulary_id': CUSTOM_VOCAB_ID,
-                            'transcriber': TRANSCRIBER
+                            'transcriber': TRANSCRIBER,
+                            'skip_postprocessing': True
                         }, sort_keys=True)
                     )
                 },
@@ -343,7 +350,8 @@ def test_submit_job_local_file_auth_options_with_success(self, mocker, mock_sess
             'remove_disfluencies': True,
             'delete_after_seconds': 0,
             'language': LANGUAGE,
-            'transcriber': TRANSCRIBER
+            'transcriber': TRANSCRIBER,
+            'skip_postprocessing': True
         }
         response = make_mock_response(url=JOB_ID_URL, json_data=data)
         mock_session.request.return_value = response
@@ -358,7 +366,8 @@ def test_submit_job_local_file_auth_options_with_success(self, mocker, mock_sess
                                                delete_after_seconds=0, language=LANGUAGE,
                                                custom_vocabulary_id=CUSTOM_VOCAB_ID,
                                                transcriber=TRANSCRIBER,
-                                               notification_config=NOTIFICATION_CONFIG)
+                                               notification_config=NOTIFICATION_CONFIG,
+                                               skip_postprocessing=True)
 
             assert res == Job(JOB_ID,
                               CREATED_ON,
@@ -392,7 +401,8 @@ def test_submit_job_local_file_auth_options_with_success(self, mocker, mock_sess
                             'delete_after_seconds': 0,
                             'language': LANGUAGE,
                             'custom_vocabulary_id': CUSTOM_VOCAB_ID,
-                            'transcriber': TRANSCRIBER
+                            'transcriber': TRANSCRIBER,
+                            'skip_postprocessing': True
                         }, sort_keys=True)
                     )
                 },
diff --git a/tests/test_streamingclient.py b/tests/test_streamingclient.py
@@ -55,7 +55,7 @@ def test_constructor_no_token_no_config(self):
 
     def test_start_noparams_success(self, mock_streaming_client, mock_generator, capsys):
         expected_query_dict = build_expected_query_dict(mock_streaming_client, None, None, None, None, None, None, None,
-            None, None)
+            None, None, None)
 
         example_data = '{"type":"partial","transcript":"Test"}'
         example_connected = '{"type":"connected","id":"testid"}'
@@ -93,9 +93,10 @@ def test_start_noparams_success(self, mock_streaming_client, mock_generator, cap
     @pytest.mark.parametrize("start_ts", [10])
     @pytest.mark.parametrize("transcriber", ["machine"])
     @pytest.mark.parametrize("language", ["en"])
+    @pytest.mark.parametrize("skip_postprocessing", [True])
     def test_start_allparams_success(self, mock_streaming_client, mock_generator, capsys,
-        metadata, custom_vocabulary_id, filter_profanity, remove_disfluencies, delete_after_seconds, detailed_partials,
-        start_ts, transcriber, language):
+        metadata, custom_vocabulary_id, filter_profanity, remove_disfluencies, delete_after_seconds,
+        detailed_partials, start_ts, transcriber, language, skip_postprocessing):
 
         expected_query_dict = build_expected_query_dict(
             mock_streaming_client,
@@ -107,7 +108,8 @@ def test_start_allparams_success(self, mock_streaming_client, mock_generator, ca
             detailed_partials,
             start_ts,
             transcriber,
-            language
+            language,
+            skip_postprocessing
         )
         example_data = '{"type":"partial","transcript":"Test"}'
         example_connected = '{"type":"connected","id":"testid"}'
@@ -124,7 +126,7 @@ def test_start_allparams_success(self, mock_streaming_client, mock_generator, ca
 
         response_gen = mock_streaming_client.start(mock_generator(),
             metadata, custom_vocabulary_id, filter_profanity, remove_disfluencies, delete_after_seconds,
-            detailed_partials, start_ts, transcriber, language)
+            detailed_partials, start_ts, transcriber, language, skip_postprocessing)
 
         called_url = mock_streaming_client.client.connect.call_args_list[0][0][0]
         validate_query_parameters(called_url, expected_query_dict)
@@ -152,7 +154,7 @@ def test_end(self, mock_streaming_client):
 
 def build_expected_query_dict(mock_streaming_client,
     metadata, custom_vocabulary_id, filter_profanity, remove_disfluencies, delete_after_seconds, detailed_partials,
-    start_ts, transcriber, language):
+    start_ts, transcriber, language, skip_postprocessing):
     expected_query_dict = {
         'access_token': mock_streaming_client.access_token,
         'content_type': mock_streaming_client.config.get_content_type_string(),
@@ -177,6 +179,8 @@ def build_expected_query_dict(mock_streaming_client,
         expected_query_dict["transcriber"] = transcriber
     if language:
         expected_query_dict["language"] = language
+    if skip_postprocessing:
+        expected_query_dict["skip_postprocessing"] = "true"
 
     return expected_query_dict