1 files changed, 732 insertions, 0 deletions
diff --git a/autogpts/autogpt/autogpt/core/resource/model_providers/openai.py b/autogpts/autogpt/autogpt/core/resource/model_providers/openai.py
new file mode 100644
index 000000000..6d1eca5e5
--- /dev/null
+++ b/autogpts/autogpt/autogpt/core/resource/model_providers/openai.py
@@ -0,0 +1,732 @@
+import enum
+import logging
+import math
+import os
+from pathlib import Path
+from typing import Callable, Coroutine, Iterator, Optional, ParamSpec, TypeVar
+
+import tenacity
+import tiktoken
+import yaml
+from openai._exceptions import APIStatusError, RateLimitError
+from openai.types import CreateEmbeddingResponse
+from openai.types.chat import ChatCompletion
+from pydantic import SecretStr
+
+from autogpt.core.configuration import Configurable, UserConfigurable
+from autogpt.core.resource.model_providers.schema import (
+    AssistantChatMessage,
+    AssistantToolCall,
+    AssistantToolCallDict,
+    ChatMessage,
+    ChatModelInfo,
+    ChatModelProvider,
+    ChatModelResponse,
+    CompletionModelFunction,
+    Embedding,
+    EmbeddingModelInfo,
+    EmbeddingModelProvider,
+    EmbeddingModelResponse,
+    ModelProviderBudget,
+    ModelProviderConfiguration,
+    ModelProviderCredentials,
+    ModelProviderName,
+    ModelProviderService,
+    ModelProviderSettings,
+    ModelProviderUsage,
+    ModelTokenizer,
+)
+from autogpt.core.utils.json_schema import JSONSchema
+
+_T = TypeVar("_T")
+_P = ParamSpec("_P")
+
+OpenAIEmbeddingParser = Callable[[Embedding], Embedding]
+OpenAIChatParser = Callable[[str], dict]
+
+
+class OpenAIModelName(str, enum.Enum):
+    ADA = "text-embedding-ada-002"
+
+    GPT3_v1 = "gpt-3.5-turbo-0301"
+    GPT3_v2 = "gpt-3.5-turbo-0613"
+    GPT3_v2_16k = "gpt-3.5-turbo-16k-0613"
+    GPT3_v3 = "gpt-3.5-turbo-1106"
+    GPT3_ROLLING = "gpt-3.5-turbo"
+    GPT3_ROLLING_16k = "gpt-3.5-turbo-16k"
+    GPT3 = GPT3_ROLLING
+    GPT3_16k = GPT3_ROLLING_16k
+
+    GPT4_v1 = "gpt-4-0314"
+    GPT4_v1_32k = "gpt-4-32k-0314"
+    GPT4_v2 = "gpt-4-0613"
+    GPT4_v2_32k = "gpt-4-32k-0613"
+    GPT4_v3 = "gpt-4-1106-preview"
+    GPT4_v4 = "gpt-4-0125-preview"
+    GPT4_ROLLING = "gpt-4"
+    GPT4_ROLLING_32k = "gpt-4-32k"
+    GPT4_TURBO = "gpt-4-turbo-preview"
+    GPT4_VISION = "gpt-4-vision-preview"
+    GPT4 = GPT4_ROLLING
+    GPT4_32k = GPT4_ROLLING_32k
+
+
+OPEN_AI_EMBEDDING_MODELS = {
+    OpenAIModelName.ADA: EmbeddingModelInfo(
+        name=OpenAIModelName.ADA,
+        service=ModelProviderService.EMBEDDING,
+        provider_name=ModelProviderName.OPENAI,
+        prompt_token_cost=0.0001 / 1000,
+        max_tokens=8191,
+        embedding_dimensions=1536,
+    ),
+}
+
+
+OPEN_AI_CHAT_MODELS = {
+    info.name: info
+    for info in [
+        ChatModelInfo(
+            name=OpenAIModelName.GPT3,
+            service=ModelProviderService.CHAT,
+            provider_name=ModelProviderName.OPENAI,
+            prompt_token_cost=0.0015 / 1000,
+            completion_token_cost=0.002 / 1000,
+            max_tokens=4096,
+            has_function_call_api=True,
+        ),
+        ChatModelInfo(
+            name=OpenAIModelName.GPT3_16k,
+            service=ModelProviderService.CHAT,
+            provider_name=ModelProviderName.OPENAI,
+            prompt_token_cost=0.003 / 1000,
+            completion_token_cost=0.004 / 1000,
+            max_tokens=16384,
+            has_function_call_api=True,
+        ),
+        ChatModelInfo(
+            name=OpenAIModelName.GPT3_v3,
+            service=ModelProviderService.CHAT,
+            provider_name=ModelProviderName.OPENAI,
+            prompt_token_cost=0.001 / 1000,
+            completion_token_cost=0.002 / 1000,
+            max_tokens=16384,
+            has_function_call_api=True,
+        ),
+        ChatModelInfo(
+            name=OpenAIModelName.GPT4,
+            service=ModelProviderService.CHAT,
+            provider_name=ModelProviderName.OPENAI,
+            prompt_token_cost=0.03 / 1000,
+            completion_token_cost=0.06 / 1000,
+            max_tokens=8191,
+            has_function_call_api=True,
+        ),
+        ChatModelInfo(
+            name=OpenAIModelName.GPT4_32k,
+            service=ModelProviderService.CHAT,
+            provider_name=ModelProviderName.OPENAI,
+            prompt_token_cost=0.06 / 1000,
+            completion_token_cost=0.12 / 1000,
+            max_tokens=32768,
+            has_function_call_api=True,
+        ),
+        ChatModelInfo(
+            name=OpenAIModelName.GPT4_TURBO,
+            service=ModelProviderService.CHAT,
+            provider_name=ModelProviderName.OPENAI,
+            prompt_token_cost=0.01 / 1000,
+            completion_token_cost=0.03 / 1000,
+            max_tokens=128000,
+            has_function_call_api=True,
+        ),
+    ]
+}
+# Copy entries for models with equivalent specs
+chat_model_mapping = {
+    OpenAIModelName.GPT3: [OpenAIModelName.GPT3_v1, OpenAIModelName.GPT3_v2],
+    OpenAIModelName.GPT3_16k: [OpenAIModelName.GPT3_v2_16k],
+    OpenAIModelName.GPT4: [OpenAIModelName.GPT4_v1, OpenAIModelName.GPT4_v2],
+    OpenAIModelName.GPT4_32k: [
+        OpenAIModelName.GPT4_v1_32k,
+        OpenAIModelName.GPT4_v2_32k,
+    ],
+    OpenAIModelName.GPT4_TURBO: [OpenAIModelName.GPT4_v3, OpenAIModelName.GPT4_v4],
+}
+for base, copies in chat_model_mapping.items():
+    for copy in copies:
+        copy_info = ChatModelInfo(**OPEN_AI_CHAT_MODELS[base].__dict__)
+        copy_info.name = copy
+        OPEN_AI_CHAT_MODELS[copy] = copy_info
+        if copy.endswith(("-0301", "-0314")):
+            copy_info.has_function_call_api = False
+
+
+OPEN_AI_MODELS = {
+    **OPEN_AI_CHAT_MODELS,
+    **OPEN_AI_EMBEDDING_MODELS,
+}
+
+
+class OpenAIConfiguration(ModelProviderConfiguration):
+    fix_failed_parse_tries: int = UserConfigurable(3)
+
+
+class OpenAICredentials(ModelProviderCredentials):
+    """Credentials for OpenAI."""
+
+    api_key: SecretStr = UserConfigurable(from_env="OPENAI_API_KEY")
+    api_base: Optional[SecretStr] = UserConfigurable(
+        default=None, from_env="OPENAI_API_BASE_URL"
+    )
+    organization: Optional[SecretStr] = UserConfigurable(from_env="OPENAI_ORGANIZATION")
+
+    api_type: str = UserConfigurable(
+        default="",
+        from_env=lambda: (
+            "azure"
+            if os.getenv("USE_AZURE") == "True"
+            else os.getenv("OPENAI_API_TYPE")
+        ),
+    )
+    api_version: str = UserConfigurable("", from_env="OPENAI_API_VERSION")
+    azure_endpoint: Optional[SecretStr] = None
+    azure_model_to_deploy_id_map: Optional[dict[str, str]] = None
+
+    def get_api_access_kwargs(self) -> dict[str, str]:
+        kwargs = {
+            k: (v.get_secret_value() if type(v) is SecretStr else v)
+            for k, v in {
+                "api_key": self.api_key,
+                "base_url": self.api_base,
+                "organization": self.organization,
+            }.items()
+            if v is not None
+        }
+        if self.api_type == "azure":
+            kwargs["api_version"] = self.api_version
+            kwargs["azure_endpoint"] = self.azure_endpoint
+        return kwargs
+
+    def get_model_access_kwargs(self, model: str) -> dict[str, str]:
+        kwargs = {"model": model}
+        if self.api_type == "azure" and model:
+            azure_kwargs = self._get_azure_access_kwargs(model)
+            kwargs.update(azure_kwargs)
+        return kwargs
+
+    def load_azure_config(self, config_file: Path) -> None:
+        with open(config_file) as file:
+            config_params = yaml.load(file, Loader=yaml.FullLoader) or {}
+
+        try:
+            assert config_params.get(
+                "azure_model_map", {}
+            ), "Azure model->deployment_id map is empty"
+        except AssertionError as e:
+            raise ValueError(*e.args)
+
+        self.api_type = config_params.get("azure_api_type", "azure")
+        self.api_version = config_params.get("azure_api_version", "")
+        self.azure_endpoint = config_params.get("azure_endpoint")
+        self.azure_model_to_deploy_id_map = config_params.get("azure_model_map")
+
+    def _get_azure_access_kwargs(self, model: str) -> dict[str, str]:
+        """Get the kwargs for the Azure API."""
+
+        if not self.azure_model_to_deploy_id_map:
+            raise ValueError("Azure model deployment map not configured")
+
+        if model not in self.azure_model_to_deploy_id_map:
+            raise ValueError(f"No Azure deployment ID configured for model '{model}'")
+        deployment_id = self.azure_model_to_deploy_id_map[model]
+
+        return {"model": deployment_id}
+
+
+class OpenAISettings(ModelProviderSettings):
+    configuration: OpenAIConfiguration
+    credentials: Optional[OpenAICredentials]
+    budget: ModelProviderBudget
+
+
+class OpenAIProvider(
+    Configurable[OpenAISettings], ChatModelProvider, EmbeddingModelProvider
+):
+    default_settings = OpenAISettings(
+        name="openai_provider",
+        description="Provides access to OpenAI's API.",
+        configuration=OpenAIConfiguration(
+            retries_per_request=10,
+        ),
+        credentials=None,
+        budget=ModelProviderBudget(
+            total_budget=math.inf,
+            total_cost=0.0,
+            remaining_budget=math.inf,
+            usage=ModelProviderUsage(
+                prompt_tokens=0,
+                completion_tokens=0,
+                total_tokens=0,
+            ),
+        ),
+    )
+
+    _budget: ModelProviderBudget
+    _configuration: OpenAIConfiguration
+
+    def __init__(
+        self,
+        settings: OpenAISettings,
+        logger: logging.Logger,
+    ):
+        self._settings = settings
+
+        assert settings.credentials, "Cannot create OpenAIProvider without credentials"
+        self._configuration = settings.configuration
+        self._credentials = settings.credentials
+        self._budget = settings.budget
+
+        if self._credentials.api_type == "azure":
+            from openai import AsyncAzureOpenAI
+
+            # API key and org (if configured) are passed, the rest of the required
+            # credentials is loaded from the environment by the AzureOpenAI client.
+            self._client = AsyncAzureOpenAI(**self._credentials.get_api_access_kwargs())
+        else:
+            from openai import AsyncOpenAI
+
+            self._client = AsyncOpenAI(**self._credentials.get_api_access_kwargs())
+
+        self._logger = logger
+
+    def get_token_limit(self, model_name: str) -> int:
+        """Get the token limit for a given model."""
+        return OPEN_AI_MODELS[model_name].max_tokens
+
+    @classmethod
+    def get_tokenizer(cls, model_name: OpenAIModelName) -> ModelTokenizer:
+        return tiktoken.encoding_for_model(model_name)
+
+    @classmethod
+    def count_tokens(cls, text: str, model_name: OpenAIModelName) -> int:
+        encoding = cls.get_tokenizer(model_name)
+        return len(encoding.encode(text))
+
+    @classmethod
+    def count_message_tokens(
+        cls,
+        messages: ChatMessage | list[ChatMessage],
+        model_name: OpenAIModelName,
+    ) -> int:
+        if isinstance(messages, ChatMessage):
+            messages = [messages]
+
+        if model_name.startswith("gpt-3.5-turbo"):
+            tokens_per_message = (
+                4  # every message follows <|start|>{role/name}\n{content}<|end|>\n
+            )
+            tokens_per_name = -1  # if there's a name, the role is omitted
+            encoding_model = "gpt-3.5-turbo"
+        elif model_name.startswith("gpt-4"):
+            tokens_per_message = 3
+            tokens_per_name = 1
+            encoding_model = "gpt-4"
+        else:
+            raise NotImplementedError(
+                f"count_message_tokens() is not implemented for model {model_name}.\n"
+                " See https://github.com/openai/openai-python/blob/main/chatml.md for"
+                " information on how messages are converted to tokens."
+            )
+        try:
+            encoding = tiktoken.encoding_for_model(encoding_model)
+        except KeyError:
+            logging.getLogger(__class__.__name__).warning(
+                f"Model {model_name} not found. Defaulting to cl100k_base encoding."
+            )
+            encoding = tiktoken.get_encoding("cl100k_base")
+
+        num_tokens = 0
+        for message in messages:
+            num_tokens += tokens_per_message
+            for key, value in message.dict().items():
+                num_tokens += len(encoding.encode(value))
+                if key == "name":
+                    num_tokens += tokens_per_name
+        num_tokens += 3  # every reply is primed with <|start|>assistant<|message|>
+        return num_tokens
+
+    async def create_chat_completion(
+        self,
+        model_prompt: list[ChatMessage],
+        model_name: OpenAIModelName,
+        completion_parser: Callable[[AssistantChatMessage], _T] = lambda _: None,
+        functions: Optional[list[CompletionModelFunction]] = None,
+        **kwargs,
+    ) -> ChatModelResponse[_T]:
+        """Create a completion using the OpenAI API."""
+
+        completion_kwargs = self._get_completion_kwargs(model_name, functions, **kwargs)
+        tool_calls_compat_mode = functions and "tools" not in completion_kwargs
+        if "messages" in completion_kwargs:
+            model_prompt += completion_kwargs["messages"]
+            del completion_kwargs["messages"]
+
+        cost = 0.0
+        attempts = 0
+        while True:
+            _response = await self._create_chat_completion(
+                messages=model_prompt,
+                **completion_kwargs,
+            )
+
+            _assistant_msg = _response.choices[0].message
+            assistant_msg = AssistantChatMessage(
+                content=_assistant_msg.content,
+                tool_calls=(
+                    [AssistantToolCall(**tc.dict()) for tc in _assistant_msg.tool_calls]
+                    if _assistant_msg.tool_calls
+                    else None
+                ),
+            )
+            response = ChatModelResponse(
+                response=assistant_msg,
+                model_info=OPEN_AI_CHAT_MODELS[model_name],
+                prompt_tokens_used=(
+                    _response.usage.prompt_tokens if _response.usage else 0
+                ),
+                completion_tokens_used=(
+                    _response.usage.completion_tokens if _response.usage else 0
+                ),
+            )
+            cost += self._budget.update_usage_and_cost(response)
+            self._logger.debug(
+                f"Completion usage: {response.prompt_tokens_used} input, "
+                f"{response.completion_tokens_used} output - ${round(cost, 5)}"
+            )
+
+            # If parsing the response fails, append the error to the prompt, and let the
+            # LLM fix its mistake(s).
+            try:
+                attempts += 1
+
+                if (
+                    tool_calls_compat_mode
+                    and assistant_msg.content
+                    and not assistant_msg.tool_calls
+                ):
+                    assistant_msg.tool_calls = list(
+                        _tool_calls_compat_extract_calls(assistant_msg.content)
+                    )
+
+                response.parsed_result = completion_parser(assistant_msg)
+                break
+            except Exception as e:
+                self._logger.warning(f"Parsing attempt #{attempts} failed: {e}")
+                self._logger.debug(f"Parsing failed on response: '''{assistant_msg}'''")
+                if attempts < self._configuration.fix_failed_parse_tries:
+                    model_prompt.append(
+                        ChatMessage.system(f"ERROR PARSING YOUR RESPONSE:\n\n{e}")
+                    )
+                else:
+                    raise
+
+        if attempts > 1:
+            self._logger.debug(f"Total cost for {attempts} attempts: ${round(cost, 5)}")
+
+        return response
+
+    async def create_embedding(
+        self,
+        text: str,
+        model_name: OpenAIModelName,
+        embedding_parser: Callable[[Embedding], Embedding],
+        **kwargs,
+    ) -> EmbeddingModelResponse:
+        """Create an embedding using the OpenAI API."""
+        embedding_kwargs = self._get_embedding_kwargs(model_name, **kwargs)
+        response = await self._create_embedding(text=text, **embedding_kwargs)
+
+        response = EmbeddingModelResponse(
+            embedding=embedding_parser(response.data[0].embedding),
+            model_info=OPEN_AI_EMBEDDING_MODELS[model_name],
+            prompt_tokens_used=response.usage.prompt_tokens,
+            completion_tokens_used=0,
+        )
+        self._budget.update_usage_and_cost(response)
+        return response
+
+    def _get_completion_kwargs(
+        self,
+        model_name: OpenAIModelName,
+        functions: Optional[list[CompletionModelFunction]] = None,
+        **kwargs,
+    ) -> dict:
+        """Get kwargs for completion API call.
+
+        Args:
+            model: The model to use.
+            kwargs: Keyword arguments to override the default values.
+
+        Returns:
+            The kwargs for the chat API call.
+
+        """
+        kwargs.update(self._credentials.get_model_access_kwargs(model_name))
+
+        if functions:
+            if OPEN_AI_CHAT_MODELS[model_name].has_function_call_api:
+                kwargs["tools"] = [
+                    {"type": "function", "function": f.schema} for f in functions
+                ]
+                if len(functions) == 1:
+                    # force the model to call the only specified function
+                    kwargs["tool_choice"] = {
+                        "type": "function",
+                        "function": {"name": functions[0].name},
+                    }
+            else:
+                # Provide compatibility with older models
+                _functions_compat_fix_kwargs(functions, kwargs)
+
+        if extra_headers := self._configuration.extra_request_headers:
+            kwargs["extra_headers"] = kwargs.get("extra_headers", {}).update(
+                extra_headers.copy()
+            )
+
+        return kwargs
+
+    def _get_embedding_kwargs(
+        self,
+        model_name: OpenAIModelName,
+        **kwargs,
+    ) -> dict:
+        """Get kwargs for embedding API call.
+
+        Args:
+            model: The model to use.
+            kwargs: Keyword arguments to override the default values.
+
+        Returns:
+            The kwargs for the embedding API call.
+
+        """
+        kwargs.update(self._credentials.get_model_access_kwargs(model_name))
+
+        if extra_headers := self._configuration.extra_request_headers:
+            kwargs["extra_headers"] = kwargs.get("extra_headers", {}).update(
+                extra_headers.copy()
+            )
+
+        return kwargs
+
+    def _create_chat_completion(
+        self, messages: list[ChatMessage], *_, **kwargs
+    ) -> Coroutine[None, None, ChatCompletion]:
+        """Create a chat completion using the OpenAI API with retry handling."""
+
+        @self._retry_api_request
+        async def _create_chat_completion_with_retry(
+            messages: list[ChatMessage], *_, **kwargs
+        ) -> ChatCompletion:
+            raw_messages = [
+                message.dict(include={"role", "content", "tool_calls", "name"})
+                for message in messages
+            ]
+            return await self._client.chat.completions.create(
+                messages=raw_messages,  # type: ignore
+                **kwargs,
+            )
+
+        return _create_chat_completion_with_retry(messages, *_, **kwargs)
+
+    def _create_embedding(
+        self, text: str, *_, **kwargs
+    ) -> Coroutine[None, None, CreateEmbeddingResponse]:
+        """Create an embedding using the OpenAI API with retry handling."""
+
+        @self._retry_api_request
+        async def _create_embedding_with_retry(
+            text: str, *_, **kwargs
+        ) -> CreateEmbeddingResponse:
+            return await self._client.embeddings.create(
+                input=[text],
+                **kwargs,
+            )
+
+        return _create_embedding_with_retry(text, *_, **kwargs)
+
+    def _retry_api_request(self, func: Callable[_P, _T]) -> Callable[_P, _T]:
+        _log_retry_debug_message = tenacity.after_log(self._logger, logging.DEBUG)
+
+        def _log_on_fail(retry_state: tenacity.RetryCallState) -> None:
+            _log_retry_debug_message(retry_state)
+
+            if (
+                retry_state.attempt_number == 0
+                and retry_state.outcome
+                and isinstance(retry_state.outcome.exception(), RateLimitError)
+            ):
+                self._logger.warning(
+                    "Please double check that you have setup a PAID OpenAI API Account."
+                    " You can read more here: "
+                    "https://docs.agpt.co/setup/#getting-an-openai-api-key"
+                )
+
+        return tenacity.retry(
+            retry=(
+                tenacity.retry_if_exception_type(RateLimitError)
+                | tenacity.retry_if_exception(
+                    lambda e: isinstance(e, APIStatusError) and e.status_code == 502
+                )
+            ),
+            wait=tenacity.wait_exponential(),
+            stop=tenacity.stop_after_attempt(self._configuration.retries_per_request),
+            after=_log_on_fail,
+        )(func)
+
+    def __repr__(self):
+        return "OpenAIProvider()"
+
+
+def format_function_specs_as_typescript_ns(
+    functions: list[CompletionModelFunction],
+) -> str:
+    """Returns a function signature block in the format used by OpenAI internally:
+    https://community.openai.com/t/how-to-calculate-the-tokens-when-using-function-call/266573/18
+
+    For use with `count_tokens` to determine token usage of provided functions.
+
+    Example:
+    ```ts
+    namespace functions {
+
+    // Get the current weather in a given location
+    type get_current_weather = (_: {
+    // The city and state, e.g. San Francisco, CA
+    location: string,
+    unit?: "celsius" | "fahrenheit",
+    }) => any;
+
+    } // namespace functions
+    ```
+    """
+
+    return (
+        "namespace functions {\n\n"
+        + "\n\n".join(format_openai_function_for_prompt(f) for f in functions)
+        + "\n\n} // namespace functions"
+    )
+
+
+def format_openai_function_for_prompt(func: CompletionModelFunction) -> str:
+    """Returns the function formatted similarly to the way OpenAI does it internally:
+    https://community.openai.com/t/how-to-calculate-the-tokens-when-using-function-call/266573/18
+
+    Example:
+    ```ts
+    // Get the current weather in a given location
+    type get_current_weather = (_: {
+    // The city and state, e.g. San Francisco, CA
+    location: string,
+    unit?: "celsius" | "fahrenheit",
+    }) => any;
+    ```
+    """
+
+    def param_signature(name: str, spec: JSONSchema) -> str:
+        return (
+            f"// {spec.description}\n" if spec.description else ""
+        ) + f"{name}{'' if spec.required else '?'}: {spec.typescript_type},"
+
+    return "\n".join(
+        [
+            f"// {func.description}",
+            f"type {func.name} = (_ :{{",
+            *[param_signature(name, p) for name, p in func.parameters.items()],
+            "}) => any;",
+        ]
+    )
+
+
+def count_openai_functions_tokens(
+    functions: list[CompletionModelFunction], count_tokens: Callable[[str], int]
+) -> int:
+    """Returns the number of tokens taken up by a set of function definitions
+
+    Reference: https://community.openai.com/t/how-to-calculate-the-tokens-when-using-function-call/266573/18  # noqa: E501
+    """
+    return count_tokens(
+        "# Tools\n\n"
+        "## functions\n\n"
+        f"{format_function_specs_as_typescript_ns(functions)}"
+    )
+
+
+def _functions_compat_fix_kwargs(
+    functions: list[CompletionModelFunction],
+    completion_kwargs: dict,
+):
+    function_definitions = format_function_specs_as_typescript_ns(functions)
+    function_call_schema = JSONSchema(
+        type=JSONSchema.Type.OBJECT,
+        properties={
+            "name": JSONSchema(
+                description="The name of the function to call",
+                enum=[f.name for f in functions],
+                required=True,
+            ),
+            "arguments": JSONSchema(
+                description="The arguments for the function call",
+                type=JSONSchema.Type.OBJECT,
+                required=True,
+            ),
+        },
+    )
+    tool_calls_schema = JSONSchema(
+        type=JSONSchema.Type.ARRAY,
+        items=JSONSchema(
+            type=JSONSchema.Type.OBJECT,
+            properties={
+                "type": JSONSchema(
+                    type=JSONSchema.Type.STRING,
+                    enum=["function"],
+                ),
+                "function": function_call_schema,
+            },
+        ),
+    )
+    completion_kwargs["messages"] = [
+        ChatMessage.system(
+            "# tool usage instructions\n\n"
+            "Specify a '```tool_calls' block in your response,"
+            " with a valid JSON object that adheres to the following schema:\n\n"
+            f"{tool_calls_schema.to_dict()}\n\n"
+            "Specify any tools that you need to use through this JSON object.\n\n"
+            "Put the tool_calls block at the end of your response"
+            " and include its fences if it is not the only content.\n\n"
+            "## functions\n\n"
+            "For the function call itself, use one of the following"
+            f" functions:\n\n{function_definitions}"
+        ),
+    ]
+
+
+def _tool_calls_compat_extract_calls(response: str) -> Iterator[AssistantToolCall]:
+    import json
+    import re
+
+    logging.debug(f"Trying to extract tool calls from response:\n{response}")
+
+    if response[0] == "[":
+        tool_calls: list[AssistantToolCallDict] = json.loads(response)
+    else:
+        block = re.search(r"```(?:tool_calls)?\n(.*)\n```\s*$", response, re.DOTALL)
+        if not block:
+            raise ValueError("Could not find tool_calls block in response")
+        tool_calls: list[AssistantToolCallDict] = json.loads(block.group(1))
+
+    for t in tool_calls:
+        t["function"]["arguments"] = str(t["function"]["arguments"])  # HACK
+
+        yield AssistantToolCall.parse_obj(t)