Page 1 of 1

致谢部分可以解释对现有内容做了哪些修改

Posted: Tue Dec 10, 2024 10:06 am
by subornaakter02
致谢可以提供更多关于人工智能贡献的背景细节,尤其是在可能造成混淆的情况下。人工智能伙伴关系指出,“插入合成生成的人工制品或从真实媒体中删除真实制品”可能会引起混淆。声明可以解释人工智能是否更改了原始内容。
或者如何使用人工智能来开发最终内容。一些在线出版物正在采用这种做法。

在许多情况下,读者并不熟悉由生成式 AI 转换的现有内容。致谢可以表明底层信息的出处,以揭示谁是其负责人。出处声明可以表明内容中信息的可信度或所有权。

来源可能很复杂。例如,一个品牌可以使用从第三方获得许可的版权内容,使用生成式 AI 对其进行转换,然后大幅修改 AI 生成的版本。

来源声明对于衍生内容很常见,无论是否由人工智能生成。以下是内容来源声明的一些示例:

本摘要源自[品牌名称]创作的版权内容,不得复制
本材料来自公开数据源
本材料取自授权内容,受其原始版权保护
上述示例描述了使用权,但这些权利仅是这些权利的例证 英国电话号码数据 而不是关于如何或何时主张版权所有权的法律指导。版权涉及许多细微​​差别,权利可能因地而异,因此请咨询相关司法管辖区的官方指导。

美国版权局的指导意见建议,作者不能对其作品的来源材料主张版权(无论是机器生成的还是由另一方开发的)。作者只能对自己创作的原创作品主张版权——他们对源材料所做的实质性更改或添加。它解释说,“艺术家可以修改最初由人工智能技术生成的材料,只要这些修改符合版权保护的标准。在这些情况下,版权只会保护作品中人类创作的部分。”

技术信号:向机器披露人工智能生成的内容

最后,出版商可以通过技术信号披露生成式人工智能的使用情况,其他分发或呈现内容的平台可以理解这些技术信号。技术信号可以帮助表明两种信任问题:

所呈现的材料在创作后是否未经修改,或者是否已被改变
内容来源是否真实如其声称的那样
技术信号比行为和口头信号有几个优势:

它们可以嵌入内容中,这样披露的内容就不会与其引用的内容分离
它们可以更精确(尽管对大多数人来说不太容易理解)
它们更加有力地支持创作、发布和分发工作流程
它们可以应用于许多渠道(例如搜索、语音)和媒体(图像、视频、音频)
技术信号有一定的局限性。它们仅在以下情况下对用户有用:

Image


他们的信息对用户是可见的,因为它被平台显示
平台利用这些信息来保护用户的利益——以用户希望的方式限制内容访问
另一个限制是,技术信号目前尚未广泛用于基于文本的内容。它们主要针对照片图像、视频和软件文件。

技术信号分为三类,它们要么涉及内容的组成,要么涉及内容的来源:

元数据
技术水印
加密签名
与 AI 生成内容相关的元数据正在快速发展。IPTC正与其他团体和科技公司合作,主导这项工作。包括 Midjourney 和 Google 的图像制作应用程序在内的多种图像工具将在其输出中添加 IPTC 元数据,图片库 Shutterstock 也将如此。

Google 已宣布将在搜索结果中使用 IPTC 属性,并建议发布商在适当的时候将其纳入。Google 宣布,“ Google 图片搜索将在搜索结果中读取并向用户显示 [标签]。”

IPTC 主要关注内容的构成,特别是照片图像和视频。他们开发了“数字源类型”词汇表,现在涵盖了一系列 AI 生成的类型。观众可能不太理解这些术语;Google对每个术语的解释如下:

训练有素的算法媒体:“使用从采样内容中得出的模型创建”
复合合成:“包含合成元素的复合材料”
算法媒体:“纯粹由算法创建,不基于任何采样的训练数据(例如,软件使用数学公式创建的图像)”
这些术语可以包含在图像文件中。Photoshop 等图像编辑软件支持承载 IPTC 属性的 XMP 和 IIM(信息交换模型)元数据字段。

技术水印是一种用于验证内容的隐形方法,旨在打击伪造和欺骗。它对于验证可能重新发布的第三方内容的完整性特别有用。它们是“嵌入内容中的技术信号,肉眼或耳朵无法察觉。”据 IBM 研究人员称,技术水印“包括将水印嵌入源图像的水印加盖过程和从加盖水印的图像中提取水印的水印提取过程。提取的水印可用于确定图像是否已被更改。”

Anthropic、Inflection、亚马逊、OpenAI、Meta、Alphabet 和微软已承诺开发“一种系统,对所有形式的内容(从文本、图像、音频到人工智能生成的视频)进行‘水印’,以便用户知道何时使用了该技术。”

有人担心水印可能会从文本内容中删除,但一位研究人员表示,需要更改近 50% 的单词才能删除水印。

加密签名是另一种表明 AI 生成内容来源的技术。这些技术提供了一种验证内容创建者的方法——承认 AI 生成本身并不坏,但重点应该放在揭露滥用 AI 生成的不良行为者。在此过程中,发布者“签署”加密数字证书,其中包含有关内容创建时间和创建者的信息。内容来源和真实性联盟制定了一项标准,微软正在其 Bing 图像创建器中采用该标准,其中还包括 IPTC 的数字源类型元数据。

在内容模型和工作流程中实施披露

在线出版商需要一个可重复的过程来披露人工智能生成的内容。内容模型和工作流程可以使披露细节的捕获制度化。

将披露结构化到内容模型中。无头 CMS 中的结构化内容可以适应披露 AI 的各种方式。结构化内容允许发布者添加不同类型的披露,以满足各种用例和利益相关者的要求。

在线出版商应将结构化字段添加到包含生成式 AI 的内容类型中。图像应成为重中之重,因为图像的用途和要求都在快速发展。

人类读者和技术平台有不同的需求,因此请务必结合人类可见的字段和机器可读的元数据。

使用机器来揭示机器的工作。一种新兴的做法是自动生成披露信息。人工智能生成工具开始将技术信号纳入其输出中。当使用生成的人工智能时,工作流程可以自动生成口头陈述以显示给读者。这可以在以下任一平台上完成:

常规基础,其中基于给定内容类型的所有内容项都使用生成的内容,因此具有标准声明
逐案处理,其中只有给定内容类型的部分内容项使用生成的 AI,并且当生成的内容输出在发布之前合并到内容项中时触发披露。
披露自动化的目的是减少作者的工作量,而不是剥夺他们的权力。只有作者才知道他们转换内容的所有方式和程度。

为未来做好准备
“人工智能几乎参与了我们信息生态系统的每个部分。人工智能参与的门槛是什么,才能使其有资格被标记? ”几年前,非营利组织 First Draft 联盟问道。他们警告说,“在人工智能输出通过社交媒体和消息平台传播时,对它们进行标记的最佳实践仍处于萌芽阶段。”

早期关于人工智能披露的大部分工作都是出于希望给那些为欺骗而制作的有害内容贴上标签的动机。但随着生成式人工智能越来越主流,并支持越来越多的合法商业目标,仅仅讨论“深度造假”已不再合适。我们需要更广泛的描述词汇。

行业范围内的披露标准和做法正在涌现。随着供应商、行业机构和监管机构增加要求和指导,我们可以期待更多发展。