add qa thread control

1cd5d5eb · jyong · 6a564e2d · 1cd5d5eb · 1cd5d5eb
Commit 1cd5d5eb authored Jul 31, 2023 by jyong
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 12 deletions

datasets_document.py api/controllers/console/datasets/datasets_document.py +2 -0

dataset_service.py api/services/dataset_service.py +1 -12

No files found.
--- a/api/controllers/console/datasets/datasets_document.py
+++ b/api/controllers/console/datasets/datasets_document.py
@@ -272,6 +272,7 @@ class DatasetDocumentListApi(Resource):
        parser.add_argument('duplicate', type=bool, nullable=False, location='json')
        parser.add_argument('original_document_id', type=str, required=False, location='json')
        parser.add_argument('doc_form', type=str, default='text_model', required=False, nullable=False, location='json')
+        parser.add_argument('doc_language', type=str, default='English', required=False, nullable=False, location='json')
        args = parser.parse_args()

        if not dataset.indexing_technique and not args['indexing_technique']:
@@ -317,6 +318,7 @@ class DatasetInitApi(Resource):
        parser.add_argument('data_source', type=dict, required=True, nullable=True, location='json')
        parser.add_argument('process_rule', type=dict, required=True, nullable=True, location='json')
        parser.add_argument('doc_form', type=str, default='text_model', required=False, nullable=False, location='json')
+        parser.add_argument('doc_language', type=str, default='English', required=False, nullable=False, location='json')
        args = parser.parse_args()

        # validate args

--- a/api/services/dataset_service.py
+++ b/api/services/dataset_service.py
@@ -498,18 +498,8 @@ class DocumentService:
                                                                     document_data["doc_form"],
                                                                     data_source_info, created_from, position,
                                                                     account, page['page_name'], batch)
-                            # if page['type'] == 'database':
-                            #     document.splitting_completed_at = datetime.datetime.utcnow()
-                            #     document.cleaning_completed_at = datetime.datetime.utcnow()
-                            #     document.parsing_completed_at = datetime.datetime.utcnow()
-                            #     document.completed_at = datetime.datetime.utcnow()
-                            #     document.indexing_status = 'completed'
-                            #     document.word_count = 0
-                            #     document.tokens = 0
-                            #     document.indexing_latency = 0
                            db.session.add(document)
                            db.session.flush()
-                            # if page['type'] != 'database':
                            document_ids.append(document.id)
                            documents.append(document)
                            position += 1
@@ -521,8 +511,7 @@ class DocumentService:
            db.session.commit()

            # trigger async task
-            #document_index_created.send(dataset.id, document_ids=document_ids)
-            document_indexing_task.delay(dataset.id, document_ids)
+            document_indexing_task.delay(dataset.id, document_ids, document_data['doc_language'])

        return documents, batch