返回

入编的那些事儿

首页
关灯
护眼
字体:
第307章 风险与控制:论生成式人工智能应用的个人信息保护(8/10)
   存书签 书架管理 返回目录
    阅读提示:为防止内容获取不全,请勿使用浏览器阅读模式。

些主张实际上都蕴含着风险控制的思维。可见,在生成式人工智能应用中,有必要将最小必要原则的风险化解释视为一项应时而生的必要措施。

    与此同时,还需要明确一些具体情形作为限制以平衡最小必要原则被风险化解释带来的不确定性。具体来看,包括以下方面:首先,个人信息的收集仍需以实现生成式人工智能运行目的为限,非实现该目的所必须的个人信息不应收集。例如,搜索记录、设备信息和通信信息等个人信息与实现生成式人工智能运行目的无关,收集此类信息无法构成“合理必要”,反而增加安全风险。其次,个人信息处理的时限亦须符合最小必要原则。根据《个人信息保护法》第47条,当生成式人工智能所存储的信息过期或不再与其训练和应用有关时,存储机构有义务在合理时间内删除或进行去标识化处理。删除机制是最小必要原则和目的限制原则的具体体现,在生成式人工智能信息储存时间难以确定的情形下,这一机制应当得到切实落实,以降低信息累积带来的风险。最后,应严格控制敏感个人信息的收集和处理。敏感个人信息使得“基本权利面临高风险损害”,全球个人信息保护体系均特别关注敏感个人信息的收集和处理,尤其是欧盟GdpR直接确立了敏感个人信息处理的“一般禁止、例外允许”的原则性规定。因此,生成式人工智能技术服务提供者必须严格控制敏感个人信息的收集和处理。即使在特定情况下难以避免收集敏感个人信息,也应尽可能避免将其用于模型训练,以降低敏感个人信息泄露的风险。

    (三)建立虚假信息生成风险的全过程应对机制

    在《生成式人工智能服务管理暂行办法》总则第四条第一款中,明确阐述了生成式人工智能的生成内容限制,尤其是不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、等虚假有害信息。因此,为了有效防控生成式人工智能带来的虚假信息生成风险,首先需明确风险来源,并清晰界定规制的对象范围。生成式人工智能核心技术基于算法模型和庞大的数据集,这是导致虚假信息生成的主要风险源头,应着重对这两方面规范,并坚持从预防到识别再到控制这一风险控制思路,建立虚假信息生成风险的全过程应对机制。具体说,该应对机制应包括以下方面:

    其一,建立可信的数据来源和算法模型。数据来源和算法模型分别是生成式人工智能的基础和核心技术,直接影响了生成式模型的质量和可信度,建立可信的数据来源和算法模型可以减少误差和漏洞的产生,从源头防范生成式人工智能生成虚假信息。根据《互联网信息服务深度合成管理规定》等相关规定,可以从以下方面来建立可信的数据来源和算法模型。一方面,应当确保所使用的数据来源的合法性和合规性,符合数据保护法、隐私保护法和知识产权法等相关法律和规定。并且应当通过数据清洗、数据归一化和数据转换等措施,以减少数据中的误差,确保数据来源的质量和准确性。当前,以chatGpt未代表的生成式人工智能既未公开其数据获取方式,也未标明语料库数据获取来源,致使语料库中数据和信息来源的合法性和真实性无从判别。为确保生成内容的真实、可信,应当根据上述规定强化这方面的合规要求。另一方面,应当使用正则化和交叉验证等技术减少算法模型过拟合,以确保模型在面对各种攻击和恶意操作时也能保持其准确性和可靠性。同时生成式人工智能技术服务提供者应当定期对其产品进行合规审查,识别和解决潜在的技术安全隐患,以保障生成文本的真实性和避免潜在的风险。

    其二,建立透明、可解释的算法模型。为保证生成式人工智能生成内容客观、真实、可信,建立透明、可解释的算法模型尤为重要。与其他语言模型一样,生成式人工智能并非完全客观、中立的工具。其对世界的“认识”取
本章未完,请点击下一页继续阅读》》
上一页 目录 下一页