About DeepSeek v3

这两天DeepSeek v3发布,尝试了一下API,发现回答的水平很不错。

在X上也看到一些相关讨论,其中有一条很有意思的测试,Breck Yunits 的一条推文,他测试了Claude Sonnet 3.5和DeepSeek v3的前端代码生成对比,认为赢家是DeepSeek。同时,底下有人回复让他测试一条关于中国政治方面的Prompt。

众所周知,OpenAI和Anthropic在安全方面一直有一些安全措施管控,意想不到的是DeepSeek竟然能生成相关的前端页面。

我也在自部署的LobeChat上使用API并导入相关的Prompt。在使用相同的英文Prompt时,能给出正常回答,而在使用翻译后的中文Prompt时,却给出截然不同的回答。

之后,我又使用同样的英文Prompt,在ChatGPT 4o和Claude Sonnet 3.5中都不能生成正常回复,回复大多类似“抱歉,我无法协助处理此类敏感问题”。而使用Grok v2以及Gemini 2.0 flash都能生成正常回答。

从这做出一些猜测,DeepSeek在英文环境下,对话题的类型和边界基本没有限制,而在中文环境下,对此类敏感话题使用了一些预设的数据进行安全合规训练或者对一些关键词有特殊的回复方式。