Update generate tts endpoint and its usage in internal chat

2025-08-26 12:27:44 +05:30 · 2025-08-26 12:27:44 +05:30 · 95a63fa609
parent 2e33a00667
commit 95a63fa609
3 changed files with 57 additions and 41 deletions
--- a/packages/server/src/controllers/text-to-speech/index.ts
+++ b/packages/server/src/controllers/text-to-speech/index.ts
@ -1,4 +1,5 @@
 import { Request, Response, NextFunction } from 'express'
 import chatflowsService from '../../services/chatflows'
 import textToSpeechService from '../../services/text-to-speech'
 import { InternalFlowiseError } from '../../errors/internalFlowiseError'
 import { StatusCodes } from 'http-status-codes'
@ -8,7 +9,16 @@ import { databaseEntities } from '../../utils'
 const generateTextToSpeech = async (req: Request, res: Response) => {
    try {
-        const { chatMessageId, text, provider, credentialId, voice, model } = req.body
+        const {
            chatId,
            chatflowId,
            chatMessageId,
            text,
            provider: bodyProvider,
            credentialId: bodyCredentialId,
            voice: bodyVoice,
            model: bodyModel
        } = req.body
        if (!text) {
            throw new InternalFlowiseError(
@ -17,6 +27,35 @@ const generateTextToSpeech = async (req: Request, res: Response) => {
            )
        }
        let provider: string, credentialId: string, voice: string, model: string
        if (chatflowId) {
            // Get TTS config from chatflow
            const chatflow = await chatflowsService.getChatflowById(chatflowId)
            const ttsConfig = JSON.parse(chatflow.textToSpeech)
            // Extract the first provider config (assuming single provider per chatflow)
            const providerKey = Object.keys(ttsConfig)[0]
            if (!providerKey) {
                throw new InternalFlowiseError(
                    StatusCodes.BAD_REQUEST,
                    `Error: textToSpeechController.generateTextToSpeech - no TTS provider configured in chatflow!`
                )
            }
            const providerConfig = ttsConfig[providerKey]
            provider = providerKey
            credentialId = providerConfig.credentialId
            voice = providerConfig.voice
            model = providerConfig.model
        } else {
            // Use TTS config from request body
            provider = bodyProvider
            credentialId = bodyCredentialId
            voice = bodyVoice
            model = bodyModel
        }
        if (!provider) {
            throw new InternalFlowiseError(
                StatusCodes.BAD_REQUEST,
@ -40,8 +79,8 @@ const generateTextToSpeech = async (req: Request, res: Response) => {
        const appServer = getRunningExpressApp()
        const options = {
            orgId: '',
-            chatflowid: '',
+            chatflowid: chatflowId || '',
-            chatId: '',
+            chatId: chatId || '',
            appDataSource: appServer.AppDataSource,
            databaseEntities: databaseEntities
        }
--- a/packages/server/src/services/chatflows/index.ts
+++ b/packages/server/src/services/chatflows/index.ts
@ -357,7 +357,18 @@ const getSinglePublicChatbotConfig = async (chatflowId: string): Promise<any> =>
        if (dbResponse.chatbotConfig || uploadsConfig) {
            try {
                const parsedConfig = dbResponse.chatbotConfig ? JSON.parse(dbResponse.chatbotConfig) : {}
-                return { ...parsedConfig, uploads: uploadsConfig, flowData: dbResponse.flowData }
+                const ttsConfig =
                    typeof dbResponse.textToSpeech === 'string' ? JSON.parse(dbResponse.textToSpeech) : dbResponse.textToSpeech
                let isTTSEnabled = false
                if (ttsConfig) {
                    Object.keys(ttsConfig).forEach((provider) => {
                        if (ttsConfig?.[provider]?.status) {
                            isTTSEnabled = true
                        }
                    })
                }
                return { ...parsedConfig, uploads: uploadsConfig, flowData: dbResponse.flowData, isTTSEnabled }
            } catch (e) {
                throw new InternalFlowiseError(StatusCodes.INTERNAL_SERVER_ERROR, `Error parsing Chatbot Config for Chatflow ${chatflowId}`)
            }
--- a/packages/ui/src/views/chatmessage/ChatMessage.jsx
+++ b/packages/ui/src/views/chatmessage/ChatMessage.jsx
@ -1342,7 +1342,7 @@ const ChatMessage = ({ open, chatflowid, isAgentCanvas, isDialog, previews, setP
                let isEnabled = false
                if (ttsConfig) {
                    Object.keys(ttsConfig).forEach((provider) => {
-                        if (ttsConfig[provider] && ttsConfig[provider].status && ttsConfig[provider].credentialId) {
+                        if (ttsConfig?.[provider]?.status) {
                            isEnabled = true
                        }
                    })
@ -1625,37 +1625,6 @@ const ChatMessage = ({ open, chatflowid, isAgentCanvas, isDialog, previews, setP
        handleTTSStart({ chatMessageId: messageId, format: 'mp3' })
        try {
            let ttsConfig = null
            if (getChatflowConfig?.data?.textToSpeech) {
                try {
                    ttsConfig =
                        typeof getChatflowConfig.data.textToSpeech === 'string'
                            ? JSON.parse(getChatflowConfig.data.textToSpeech)
                            : getChatflowConfig.data.textToSpeech
                } catch (error) {
                    console.error('Error parsing TTS config:', error)
                }
            }
            let activeProvider = null
            let providerConfig = null
            if (ttsConfig) {
                Object.keys(ttsConfig).forEach((provider) => {
                    if (ttsConfig?.[provider]?.status) {
                        activeProvider = provider
                        providerConfig = ttsConfig[provider]
                    }
                })
            }
            if (!activeProvider || !providerConfig || !providerConfig.credentialId) {
                enqueueSnackbar({
                    message: 'Text-to-speech is not configured for this chatflow',
                    options: { variant: 'warning' }
                })
                return
            }
            const abortController = new AbortController()
            setTtsStreamingState((prev) => ({ ...prev, abortController }))
@ -1668,13 +1637,10 @@ const ChatMessage = ({ open, chatflowid, isAgentCanvas, isDialog, previews, setP
                credentials: 'include',
                signal: abortController.signal,
                body: JSON.stringify({
                    chatflowId: chatflowid,
                    chatId: chatId,
                    chatMessageId: messageId,
-                    text: messageText,
+                    text: messageText
                    provider: activeProvider,
                    credentialId: providerConfig.credentialId,
                    voice: providerConfig.voice,
                    model: providerConfig.model
                })
            })