人工智能正在改变着商业和人类活动的几乎所有领域。然而,人工智能作为一种具有商业可行性的技术仍然处于起步阶段。如今大多数的人工智能技术都属于机器学习类别,通过使用高级算法和统计模型来识别大数据集中的模式。这些模式和模型可用于创建能够对现实世界事件进行评估和响应的预测系统,例如,自动电子邮件过滤系统、可以监测心脏状况的智能手表以及自动驾驶汽车。
虽然最终结果易于总结,但创建具有商业可行性的人工智能工具所需的开发工作非常复杂,需要大量的技术和商业知识以及海量多样的数据集。因此,人工智能开发比以前的许多技术更需要协作。不同的发明者(公司和个人)必须将其专业知识和资产系统地结合起来,才能进行有效的开发。例如,飞机制造商如想要确定部件故障的风险,可能需要先前数十年的检查和评估数据。但是,由于内部缺乏人工智能专业知识,他们必须通过人工智能分析公司来帮助构建预测工具。
在人工智能协作中,数据所有者应考虑收集数据的目的和数据的质量。一般来说,不同的人出于不同的目的使用不同的程序收集到的数据是不同的。此类数据通常不完整,包含错误和不一致的内容。当这些数据用于机器学习系统培训时,数据缺陷可能(并且通常确实)会影响结果预测系统的准确性。剔除或清理初始数据集可以提高机器学习系统的质量,尽管这可能需要花费时间和很高的成本。数据也可能表现出偏见。例如,求职和招聘数据可能会显示针对特定申请人群体的偏见。使用偏离数据培训的机器学习系统将呈现出相同的偏差。也许从来没有一种技术能像机器学习一样如此完整地诠释这句格言:“输入的是垃圾,输出的也是垃圾”(GarbageIn,GarbageOut)。
使用多样化的数据对机器学习系统进行训练通常会产生更好的结果。例如,如果可以从所有制造商处收集训练数据,那么飞机制造商可以共同搭建一个更好的系统来预测部件故障。这种跨行业合作正在发展,并且引入了其他法律问题。有关各方必须考虑他们每个人拥有和使用结果系统的权利、独立改进系统的权利,以及改进是否必须共享或是否可以保持私有等问题。有关各方还需考虑数据相关的隐私和保密问题。例如,如果机器学习项目显示一个公司的数据集有偏差,或者安全检查计划有缺陷,那么每个保密信息的合作者需要履行什么权利和义务。
在进行合作时,数据所有者和算法专家必须仔细评估与其资产和项目目标相关的风险,以确定他们可以作出何种表述和保证。建立分阶段产品开发周期可能是不错的办法,这样做可以有机会尽早评估概念验证或雏型系统。如果项目成功的可能性较小,可以进行重新设计或停止项目,无需花费更多费用。
有些合作将会产生有价值的知识产权,使用专利保护通常是一个好的选择。专利系统将让较早提交申请(从各角度对发明进行全面描述)的发明者获得回报。描述应至少涵盖该发明未来3年至5年的用途。肤浅或狭窄的技术公开可能无法帮助申请人获得强大的专利权。更糟糕的是,无论是否获得专利授权,大多数专利申请都会被公布。因此,糟糕的专利申请可能会将公司的技术传授给竞争对手,但却无法获得有价值的专利。
某些发明并不适合申请专利。原因可能是无法满足可授予专利的法律标准,或者发明人无法对发明进行正确的描述,再或者专利不能提供足够的保护防止竞争对手侵权等。那么对此类发明采取商业秘密保护可能是更好的选择。合作者应该预先决定由谁负责制定保护策略和实施决策。如果发明要申请专利,则应考虑所有合作者的要求,负责方必须确保在所有适用的司法管辖区提交高质量的专利申请以供审查员审查。
随着商业人工智能的发展超越了机器学习,人工智能协同开发中产生的法律和知识产权挑战将持续增加。有效利用人工智能技术制造商品的公司将获得丰厚的回报,但也将不得不在此过程中解决许多法律上的潜在问题。(编译自www.lexology.com)
翻译:王丹校对:罗先群