feat: optimize minimax llm call (#1312)

2851a9f0 · takatost · GitHub · c536f85b · 2851a9f0 · 2851a9f0
Unverified Commit 2851a9f0 authored Oct 11, 2023 by takatost Committed by GitHub Oct 11, 2023
3 changed files
--- a/api/core/model_providers/models/llm/minimax_model.py
+++ b/api/core/model_providers/models/llm/minimax_model.py
-import decimal
 from typing import List, Optional, Any
 from langchain.callbacks.manager import Callbacks
-from langchain.llms import Minimax
 from langchain.schema import LLMResult
 from core.model_providers.error import LLMBadRequestError
 from core.model_providers.models.llm.base import BaseLLM
-from core.model_providers.models.entity.message import PromptMessage, MessageType
+from core.model_providers.models.entity.message import PromptMessage
 from core.model_providers.models.entity.model_params import ModelMode, ModelKwargs
+from core.third_party.langchain.llms.minimax_llm import MinimaxChatLLM
 class MinimaxModel(BaseLLM):
-    model_mode: ModelMode = ModelMode.COMPLETION
+    model_mode: ModelMode = ModelMode.CHAT
    def _init_client(self) -> Any:
        provider_model_kwargs = self._to_model_kwargs_input(self.model_rules, self.model_kwargs)
-        return Minimax(
+        return MinimaxChatLLM(
            model=self.name,
-            model_kwargs={
+            streaming=self.streaming,
-                'stream': False
-            },
            callbacks=self.callbacks,
            **self.credentials,
            **provider_model_kwargs
@@ -49,7 +46,7 @@ class MinimaxModel(BaseLLM):
        :return:
        """
        prompts = self._get_prompt_from_messages(messages)
-        return max(self._client.get_num_tokens(prompts), 0)
+        return max(self._client.get_num_tokens_from_messages(prompts), 0)
    def get_currency(self):
        return 'RMB'
@@ -65,3 +62,7 @@ class MinimaxModel(BaseLLM):
            return LLMBadRequestError(f"Minimax: {str(ex)}")
        else:
            return ex
+    @property
+    def support_streaming(self):
+        return True
--- a/api/core/model_providers/providers/minimax_provider.py
+++ b/api/core/model_providers/providers/minimax_provider.py
@@ -2,7 +2,7 @@ import json
 from json import JSONDecodeError
 from typing import Type
-from langchain.llms import Minimax
+from langchain.schema import HumanMessage
 from core.helper import encrypter
 from core.model_providers.models.base import BaseProviderModel
@@ -10,6 +10,7 @@ from core.model_providers.models.embedding.minimax_embedding import MinimaxEmbed
 from core.model_providers.models.entity.model_params import ModelKwargsRules, KwargRule, ModelType
 from core.model_providers.models.llm.minimax_model import MinimaxModel
 from core.model_providers.providers.base import BaseModelProvider, CredentialsValidateFailedError
+from core.third_party.langchain.llms.minimax_llm import MinimaxChatLLM
 from models.provider import ProviderType, ProviderQuotaType
@@ -98,14 +99,14 @@ class MinimaxProvider(BaseModelProvider):
                'minimax_api_key': credentials['minimax_api_key'],
            }
-            llm = Minimax(
+            llm = MinimaxChatLLM(
                model='abab5.5-chat',
                max_tokens=10,
                temperature=0.01,
                **credential_kwargs
            )
-            llm("ping")
+            llm([HumanMessage(content='ping')])
        except Exception as ex:
            raise CredentialsValidateFailedError(str(ex))

--- a/api/core/third_party/langchain/llms/minimax_llm.py
+++ b/api/core/third_party/langchain/llms/minimax_llm.py