近日,有外媒报道称,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型,违反了OpenAI的服务条款,其账户已被OpenAI暂停。
今天下午,字节跳动相关负责人就相关问题向雷峰网(公众号:雷峰网)回应称,公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。
此外,外媒还报道指称,字节跳动员工大量使用OpenAI的技术,以至于参与代号“种子计划”的员工经常达到OpenAI API的最大访问上限。
雷峰网了解到,字节跳动发言人约迪·赛斯(Jodi Seth)此前回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。
今天下午,字节跳动相关负责人对OpenAI服务相关情况进行了如下具体解释:
1、今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API 调用规范检查后,这种做法已经停止。
2、早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。
3、9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型训练数据与GPT的相似度,避免数据标注人员私自使用GPT。
4、未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。