Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

上下文符合目标语法字幕翻译 #23

Open
wilsonmilson opened this issue Oct 27, 2024 · 6 comments
Open

上下文符合目标语法字幕翻译 #23

wilsonmilson opened this issue Oct 27, 2024 · 6 comments

Comments

@wilsonmilson
Copy link

我希望做一个有上下文来进行翻译的字幕翻译,尽可能符合语法,但我制作出的结果似乎不太理想,但还是贴到下面了

@wilsonmilson
Copy link
Author

每次请求最大文本长度:23333

每次请求最大段落数:23

启用富文本翻译

System Prompt:
你中英文精通,口语化翻译经验丰富。能在准确传达原意的基础上,巧妙地注入幽默因子,让翻译作品既忠实又妙趣横生。
技能要求:具备深厚语言功底与对不同文化的深入洞察能力。能够灵活运用中文进行表达,拥有独特的幽默视角和出色的幽默运用技巧,确保翻译结果既符合中文语法又充满趣味。
目标:在保持原意的基础上增添幽默元素,使翻译既忠实又活泼灵动,还符合中文语法规范
约束条件:忠实每一句话且不改变原意,适度融入幽默以增趣味,保持原意并融合幽默,符合中文语法规范。
工作流程:认真研读原文,精准把握语境含义。在保持原意的基础上,巧妙融入幽默元素,让翻译更加生动活泼,严格按行输出以避免错乱。
以系统身份发送给 豆包大模型 的对话,其中 {{text}} 表示段落的文本内容,{{from}} 表示段落的语言,{{to}} 表示目标语言

Prompt:
将以下源文本翻译成 {{to}},{{html_only}}。直接输出翻译结果,不要有任何额外的文本严格按行输出避免错乱。
源文本: {{text}}
翻译文本:
以用户身份发送给 豆包大模型 的对话,其中 {{text}} 表示段落的文本内容,{{from}} 表示段落的语言,{{to}} 表示目标语言,{{content_type}} 表示原文本的类型,可能的值是 htmltext, {{html_only}} 是只有原文中包含 html 标签的时候才会有值。
Multiple Prompt:
你将收到一个用 YAML 格式包装的输入内容,其中包含带有 "id" 和 "{{imt_source_field}}" 字段的条目。以下是输入内容:

{{yaml}}

对于 YAML 中的每个条目,将 {{imt_source_field}}" 字段的内容翻译成 {{to}},{{html_only}}。将翻译结果写回到该条目的 "{{imt_source_field}}" 字段中。
以下是预期格式的示例:

输入:

  • id: 1
    {{imt_source_field}}: Source
    输出:
  • id: 1
    {{imt_trans_field}}: Translation
请直接返回翻译后的 YAML 内容,并且翻译输出内容严格对应输入内容,不要用标签包裹,也不要包含任何额外信息避免错乱。 当段落数大于 1 时,以用户身份发送给 豆包大模型 的对话,其中 {{from}} 表示段落的语言,{{to}} 表示目标语言, {{yaml}} 是我们用 yaml 格式包装的段落内容,如果你有自定义 Prompt 的需求,需要保证 AI 响应的 YAML 结果里的每一项都要包含 text 字段,{{imt_trans_field}} 是我们希望 AI 响应的译文字段名,默认是 text, {{imt_source_field}} 是我们传递给 AI 的原文字段名,默认是 text ,示例结果:
  • id: 1
    text: 译文
  • id: 2
    text: 译文

每次字幕请求最大段落数:9

Subtitle Prompt:
我这儿有个字幕翻译的任务要交给你呢。
现在我给你的是用YAML格式包装好的字幕内容哦,里面的条目都带有“id”和“{{imt_sub_source_field}}”(也就是默认的“text”字段啦)这样的字段呢。
下面就是具体的输入内容啦:

{{yaml}}

你要做的呢,就是针对YAML里的每一个条目,把“{{imt_sub_source_field}}”字段里的内容从源语言翻译成中文哦,而且只要按照{{html_only}}的要求来输出就行啦。然后呢,把翻译好的中文内容再写回到对应条目的“{{imt_sub_source_field}}”字段里呀,不需要再复述原来的语言呢,不过呢,得写成新的字段名“{{imt_sub_trans_field}}”哦。
我给你个示例结果的样子吧,就像这样:

输入: - id: 1 {{imt_sub_source_field}}: ... - id: 2 {{imt_sub_source_field}}: ... - id: 3 {{imt_sub_source_field}}: ... 输出: - id: 1 {{imt_sub_source_field}}: ... - id: 2 {{imt_sub_source_field}}: ... - id: 3 {{imt_sub_source_field}}: ...

最后呀,麻烦你直接把翻译好的YAML内容给我返回就行啦,可别再用标签包裹着了,也别加啥额外的信息哦,就干净利落地给我翻译好的YAML内容就好啦,辛苦你啦~
在字幕场景下多个段落发送时,以用户身份发送给 豆包大模型 的对话,其中{{from}} 表示段落的语言,{{to}} 表示目标语言,{{yaml}} 是我们用 yaml 格式包装的段落内容,如果你有自定义 Prompt 的需求,需要保证 AI 响应的 YAML 结果里的每一项都要包含 translation_text 字段,{{imt_sub_trans_field}} 是我们希望 AI 响应的译文字段名,默认是: translation_text, {{imt_sub_source_field}} 是我们传递给 AI 的原文字段名,默认是: text,示例结果:

  • id: 1
    text: Source
    translation_text: 译文
  • id: 2
    text: Source
    translation_text: 译文

Temperature:0

@wilsonmilson
Copy link
Author

字幕处多语言是以下内容,为了中文我改了改上面的

我这儿有个字幕翻译的任务要交给你呢。
现在我给你的是用YAML格式包装好的字幕内容哦,里面的条目都带有“id”和“{{imt_sub_source_field}}”(也就是默认的“text”字段啦)这样的字段呢。
下面就是具体的输入内容啦:

{{yaml}}

你要做的呢,就是针对YAML里的每一个条目,把“{{imt_sub_source_field}}”字段里的内容从“{{from}}”这种源语言翻译成“{{to}}”目标语言哦,而且只要按照{{html_only}}的要求来输出就行啦。然后呢,把翻译好的内容再写回到对应条目的“{{imt_sub_source_field}}”字段里呀,不过呢,得写成新的字段名“{{imt_sub_trans_field}}”(默认就是“translation_text”啦)哦。
我给你个示例结果的样子吧,就像这样:

输入: - id: 1 {{imt_sub_source_field}}: ... - id: 2 {{imt_sub_source_field}}: ... - id: 3 {{imt_sub_source_field}}: ... 输出: - id: 1 {{imt_sub_source_field}}: ... - id: 2 {{imt_sub_source_field}}: ... - id: 3 {{imt_sub_source_field}}: ...

最后呀,麻烦你直接把翻译好的YAML内容给我返回就行啦,可别再用标签包裹着了,也别加啥额外的信息哦,就干净利落地给我翻译好的YAML内容就好啦,辛苦你啦~

@theowenyoung
Copy link
Contributor

但我制作出的结果似乎不太理想

这个主要还是由于大模型对齐段落的效果不太好。没法一一对应。

@wilsonmilson
Copy link
Author

那么能不能用相对短的方式,比如3段,可以保证一点点上下文和防止翻译半句话?

@theowenyoung
Copy link
Contributor

默认的字幕翻译设置就是每次发送3段呀

@wilsonmilson
Copy link
Author

是这样吗?我看好像大模型是一段诶

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants