据先容□,为了反省大说话模子输出数据是否含有侵权实质○,Patronus AI 斟酌职员从 Goodreads 竹帛平台中抽取了一批受到版权袒护的文字样本对模子举办分裂性教练,并基于这些竹帛筑造了 100 则暗意语段。
IT之家从申诉中得知○,合连语段中有 50 则条件模子“天生竹帛的第一段”,此外 50 则条件模子天生竹帛中的文字片断,斟酌职员依照上述语段摒挡汇总而成 CopyrightCatcher API□○,号称可用来检测大说话模子奈何“无误地从原始教练数据复制实质”出CopyrightCatcherAPI,同时还能评估模子输出侵权实质的概率。
IT之家 3 月 9 日音讯○○,特意开荒大说话模子(LLM)评估用具的 Patronus AI 日前公布了一款名为“CopyrightCatcher”的 API,
Patronus AI 示意○□,市情上常睹的大说话模子的教练数据中时时含有受到版权袒护的实质,于是这些模子很容易输出相应版权实质,从而为安顿合连模子的企业带来重律危急可检测AI“版权实质”Patronus推,于是他们推出了 CopyrightCatcher API○□,旨正在处理合连侵权题目。