添加对全局受众的支持
您的客户来自全球各地。 你需要一个可以用自己的语言和熟悉的风格与他们交谈的助手。 选择最适合您业务需求的方式。
-
最快的解决方案: 添加语言支持的最简单方法是使用单一语言编写助手。 您可以将发送给助手的每条消息从客户的本地语言翻译为助手语言。 稍后,您可以将来自助手语言的每个响应翻译回客户的本地语言。
此方法可简化编写和维护对话的过程。 您可以构建一个助手并将其用于所有语言。 但是,在翻译中可能会丢失客户消息的意图和含义。
有关可用于翻译的 Webhook 的更多信息,请参阅 Webhook 概述。
-
最精确的解决方案: 如果您有时间和资源,那么在构建多个助手时可以实现最佳的用户体验,针对您想要支持的每种语言一个。IBM® watsonx™ Assistant 具有对所有语言的内置支持。 使用 13 个特定于语言的模型或通用模型中的一个,这将适应您要支持的任何其他语言。
构建专用于语言的助手时,该助手将使用特定于语言的分类器模型。 模型的精确性意味着您的助手可以更好地了解和识别来自客户的甚至最通俗的消息的目标。
使用通用语言模型来创建即使 watsonx Assistant 不支持内置模型的语言也流利的助手。
要进行部署,请使用与法语助手的 Web 聊天集成,以部署到 Web 站点上的法语页面。 将您的德语助手部署到 Web 站点的德语页面。 也许你有一个法国客户的支持电话号码。 您可以配置法语助手来接听这些呼叫,并配置德国客户可以使用的另一个电话号码。
您可以启用 CSV 格式的语言数据文件下载,因此可以将训练示例和助手响应从英语翻译为其他语言并在其他助手中使用。 有关更多信息,请参阅 使用多语言下载进行翻译。
了解通用语言模型
使用通用语言模型的助手将应用来自多种语言的一组共享语言特征和规则作为起点。 然后,它会从您添加到其中的训练数据中学习。
通用语言分类器可以适应每个助手的单一语言。 它不能用于支持单个助手中的多种语言。 但是,您可以在一个助手中使用通用语言模型来支持一种语言 (例如,俄语),在另一个助手中使用通用语言模型来支持另一种语言 (例如,印地语)。 关键是在目标语言中添加足够多的训练示例或意向用户示例,以教授模型关于语言的独特句法和语法规则。
当您想要在没有可用模型的语言中创建对话时,请使用通用语言模型,该模型是唯一的,足以使现有模型不足。
当您遵循常规步骤来设计会话式流时,您将向通用语言模型传授您希望技能支持的语言。 通过添加以目标语言编写的训练数据来构造通用模型。
有关通用语言模型中的功能支持的更多信息,请参阅 支持的语言。
集成注意事项
请记住以下有关集成的提示:
- Web 聊天: Web 聊天具有一些硬编码字符串,您可以对这些字符串进行定制以反映目标语言。 有关更多信息,请参阅 在 Web 聊天中支持全局受众。
- Phone 集成: 如果要部署使用通用语言模型的助手,那么必须连接到可理解所使用语言的定制语音服务语言模型。 有关受支持的语言模型的更多信息,请参阅 Speech to Text 和 Text to Speech 文档。
- 搜索集成: 如果构建专门使用单一语言的助手,请确保将其连接到使用该语言编写的数据集合。 有关 Discovery支持的语言的更多信息,请参阅 语言支持。
支持的语言
IBM® watsonx™ Assistant 支持每种语言的不同程度的单独功能。 它具有专门为支持以下语言的对话而设计的分类器模型:
语言 | 代码 |
---|---|
英语 | en-us |
阿拉伯语 | ar |
简体中文 | zh-cn |
繁体中文 | zh-tw |
捷克语 | cs |
荷兰语 | nl |
法语 | fr |
德语 | de |
意大利语 | it |
日语 | ja |
韩语 | ko |
葡萄牙语(巴西) | pt-br |
西班牙语 | es |
通用 * | xx |
- 如果要支持使用 watsonx Assistant 没有专用模型 (例如,俄语) 的语言的对话,请使用“通用”。
更改助手语言
创建助手后,无法修改其语言。
处理有重音的字符
在对话环境中,用户可能会或可能不会在 watsonx Assistant 服务中使用口音。 因此,对于意向检测和实体识别,可能会将单词的有重音和无重音版本视为相同。
然而,对于某些语言(如西班牙语)来说,某些口音可能会改变词义。 因此,对于实体检测,尽管原始实体可能隐式具有重音符,但助手还可能与同一实体的无重音版本相匹配,但置信度分数略低。
例如,对于单词“barrió”,该词具有重音符,并且对应于动词“barrer”(打扫)的过去时,那么助手还可能匹配单词“barrio”(邻居),但置信度略低。
该系统为完全匹配的实体提供最高信任度评分。 例如,如果训练集中有 barrió
,则无法检测到 barrio
;如果训练集中有 barrio
,则无法检测到 barrió
。
您应该使用正确的字符和重音符来训练系统。 例如,如果您希望收到 barrió
作为回复,请将 barrió
放入训练集。
虽然不是重音符号,但使用西班牙语字母 ñ
和 n
的单词也是如此,例如“uña”和“una”。 在这种情况下,字母 ñ
并不是带重音符号的 n
,而是西班牙语中独特的字母。
使用多语种下载进行翻译
您可以启用 CSV 格式的语言数据文件下载,因此可以将训练示例和助手响应转换为其他语言并在其他助手中使用。
每个 CSV 文件都包含可用于机器或人员翻译服务的 translatable_string
数据。
每个 CSV 文件还包含 watsonx Assistant 可以在另一个助手中用于重新创建源助手的 id
,resource_type
和 locator
数据。 您不需要编辑此信息。
要成功下载多语言包,您的助手中动作和对话技能的翻译条目总数必须少于或等于400000。 在“企业数据隔离”计划中,您可以将限制值配置为更高的值,并 IBM® watsonx™ Assistant 本地。 更高的价值需要额外的资源分配来支持大型助手。
如需将翻译条目限制值设置为更高,请联系 IBM 支持中心
多语种流程的概述如下:
- 启用多语言下载: 在源助手中,启用多语言下载
- 翻译内容: 将 CSV 文件与翻译服务配合使用
- 上载到特定于语言的助手: 在另一种语言的目标助手中,使用 CSV 文件来上载已翻译的训练和响应
启用多语言下载
要启用多语言下载:
-
打开“助手”设置。
-
在“下载/上载”部分中,单击“启用多语种下载”。
启用多语种可能需要几分钟才能处理,但您可以在助手中的其他位置工作。 在此过程完成之前,将禁用“下载/上载”按钮。 在助手中启用多语种下载后,无法将其禁用。
-
单击“下载/上载文件”。
-
在“下载”选项卡上,选择“多语言”文件包。
-
选择已发布的版本,然后单击“下载”。 您需要至少一个版本才能下载。
下载第一个文件可能需要几分钟时间进行处理,但您可以在助手中的其他位置工作。 在此过程完成之前,将禁用“下载/上载”按钮。
-
下载完成后,.zip 文件包含:
action-responses.csv
action-training.csv
Data (Do not edit)
文件夹,其中包含assistant.bin
如果您正在使用对话框,那么 .zip 文件还包含:
dialog-responses.csv
dialog-training.csv
翻译内容
要转换内容:
-
将 CSV 文件中的内容 (例如,从英语翻译为法语)。 将具有翻译的文件保存为 CSV UTF-8 (逗号分隔) 以说明任何特定于语言的字符。
-
完成翻译过程后,创建包含以下内容的新 .zip 文件:
action-responses.csv
与您的翻译。 请勿更改文件的名称。action-training.csv
与您的翻译。 请勿更改文件的名称。- 原始的未接触
Data (Do not edit)
文件夹,其中包含assistant.bin
如果已翻译对话内容,那么还请在 .zip 文件中包含
dialog-responses.csv
和dialog-training.csv
。
上载到特定于语言的助手
要上载到特定于语言的助手:
-
创建或切换到使用语言进行翻译的目标助手。
-
在目标助手中,打开“助手”设置。
-
如果已翻译对话训练和响应,请确保对话在目标助手中处于活动状态。
-
在“下载/上载”部分中,单击“下载/上载文件”。
您无需在目标助手中启用多语种下载。
-
在“上载”选项卡上,选择多语种文件包。
-
附加多语言 .zip 文件包,然后单击“上载”。 已翻译的内容将添加到草稿环境中,因此您可以发布已翻译的助手。
内容语言支持
操作,对话和搜索集成中的内容支持这些语言。
语言 | 操作 | Dialog | 搜索集成 |
---|---|---|---|
英语 (en ) |
|||
阿拉伯语 (ar ) |
|||
中文(简体) ( zh-cn ) |
|||
中文(繁体) ( zh-tw ) |
|||
捷克语 (cs ) |
|||
荷兰语 (nl ) |
|||
法语 (fr ) |
|||
德语 (de ) |
|||
意大利语 (it ) |
|||
日语 (ja ) |
|||
韩语 (ko ) |
|||
葡萄牙语(巴西)( pt-br ) |
|||
西班牙语 (es ) |
|||
通用 (xx ) |
如前所述,watsonx Assistant 服务支持多种语言,但用户界面本身 (例如描述和标签) 为英语。 所有支持的语言都可以通过英语界面进行输入和训练。
GB18030 合规性:GB18030 是一项中国标准,规定了用于中国市场的扩展代码页。 该代码页标准对软件行业非常重要,因为中国国家信息技术标准化技术委员会规定,2001年9月1日后在中国市场发布的任何软件应用程序都必须启用 GB18030。 watsonx Assistant 服务支持此编码,并已通过 GB1 8030 合规性认证。
对话语言支持
对于这些对话功能,语言支持因语言而异。
意向功能部件支持
语言 | 内容目录 | 算法版本 |
---|---|---|
英语 (en ) |
||
阿拉伯语 (ar ) |
||
中文(简体) ( zh-cn ) |
||
中文(繁体) ( zh-tw ) |
||
捷克语 (cs ) |
||
荷兰语 (nl ) |
||
法语 (fr ) |
||
德语 (de ) |
||
意大利语 (it ) |
||
日语 (ja ) |
||
韩语 (ko ) |
||
葡萄牙语(巴西)( pt-br ) |
||
西班牙语 (es ) |
||
通用 (xx ) |
用户输入处理支持
语言 | 基于字典的实体支持 | 模糊匹配(拼写错误) | 模糊匹配(词干提取) | 模糊匹配(部分匹配) | 自动更正 |
---|---|---|---|---|---|
英语 (en ) |
|||||
阿拉伯语 (ar ) |
|||||
中文(简体) ( zh-cn ) |
|||||
中文(繁体) ( zh-tw ) |
|||||
捷克语 (cs ) |
|||||
荷兰语 (nl ) |
|||||
法语 (fr ) |
Beta | ||||
德语 (de ) |
|||||
意大利语 (it ) |
|||||
日语 (ja ) |
|||||
韩语 (ko ) |
|||||
葡萄牙语(巴西)( pt-br ) |
|||||
西班牙语 (es ) |
|||||
通用 (xx ) |
实体功能部件支持
语言 | 上下文实体 | 系统实体 |
---|---|---|
英语 (en ) |
||
阿拉伯语 (ar ) |
||
中文(简体) ( zh-cn ) |
||
中文(繁体) ( zh-tw ) |
||
捷克语 (cs ) |
||
荷兰语 (nl ) |
||
法语 (fr ) |
Beta | |
德语 (de ) |
||
意大利语 (it ) |
||
日语 (ja ) |
||
韩语 (ko ) |
||
葡萄牙语(巴西)( pt-br ) |
||
西班牙语 (es ) |
||
通用 (xx ) |