From e1db14f2c5d79c869834f2acc114779b9f86aa77 Mon Sep 17 00:00:00 2001
From: fit2cloud-chenyw <yawen.chen@fit2cloud.com>
Date: Tue, 17 Mar 2026 11:36:10 +0800
Subject: [PATCH] fix: The max_tokens parameter in the model configuration is
 invalid

---
 backend/apps/ai_model/openai/llm.py | 22 +++++++++++++++++++++-
 1 file changed, 21 insertions(+), 1 deletion(-)

diff --git a/backend/apps/ai_model/openai/llm.py b/backend/apps/ai_model/openai/llm.py
index 3867e7b6c..a03693c66 100644
--- a/backend/apps/ai_model/openai/llm.py
+++ b/backend/apps/ai_model/openai/llm.py
@@ -1,5 +1,5 @@
 from collections.abc import Iterator, Mapping
-from typing import Any, cast
+from typing import Any, Optional, cast
 
 from langchain_core.language_models import LanguageModelInput
 from langchain_core.messages import (
@@ -84,6 +84,26 @@ def _convert_delta_to_message_chunk(
 
 
 class BaseChatOpenAI(ChatOpenAI):
+    @property
+    def _default_params(self) -> dict[str, Any]:
+        max_tokens = self.max_tokens
+        params = super()._default_params
+        if max_tokens:
+            params["max_tokens"] = max_tokens
+        return params
+    
+    def _get_request_payload(
+        self,
+        input_: LanguageModelInput,
+        *,
+        stop: Optional[list[str]] = None,
+        **kwargs: Any,
+    ) -> dict:
+        max_tokens = self.max_tokens
+        payload = super()._get_request_payload(input_, stop=stop, **kwargs)
+        if max_tokens:
+            payload["max_tokens"] = max_tokens
+        return payload
     usage_metadata: dict = {}
 
     # custom_get_token_ids = custom_get_token_ids