Welcome to the official website of 中科专利商标代理有限责任公司!

学术论文——人工智能领域中通用模型与专利保护客体之间冲突的解决策略

Category: 行业资讯 Time: 2022-10-25


人工智能领域中通用模型与专利保护客体之间冲突的解决策略


                                                            文 | 鄢功军

                            摘要:人工智能领域的专利申请往往与算法等抽象规则和通用方法紧密关联,此类专利申请是否属于专利保护客体一直是业内十分关注的问题,也是研究热点和难点。通用模型是指能够广泛应用于不同的技术领域,而不限于某一具体的技术领域的泛化模型。关于通用模型的处理方案往往不需要限定具有确切物理含义的数据,但关于通用模型的权利要求请求保护的方案中所处理的数据如果不具有确切的物理含义,通常不属于《专利法》第二条第二款规定的专利保护客体。本文主要探讨如何减缓或规避通用模型与专利保护客体之间的冲突,使得关于通用模型的权利要求请求保护的方案尽可能满足专利保护客体。

关键词:人工智能 通用模型 技术领域 专利保护客体

1引言

                            人工智能是计算机科学的一个分支,它企图了解智能的实质,生产出能够模拟人类处理方式并做出反应的智能机器。在我国制定的《人工智能标准化白皮书2018》中认为,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统[1]


                            人工智能的应用领域非常广泛,例如,包括但不限于自动翻译、智能客服、智能搜索和自动驾驶等应用领域。算法工程师可以针对具体的应用领域训练得到相应的人工智能模型来解决该应用领域所遇到的技术问题。


                            现行的《专利审查指南》[2] 中规定,如果权利要求中涉及算法的各个步骤体现出与所要解决的技术问题密切相关,如算法处理的数据是技术领域中具有确切技术含义的数据,算法的执行能直接体现出利用自然规律解决某一技术问题的过程,并且获得了技术效果,则通常该权利要求限定的解决方案属于专利法第二条第二款所述的技术方案。


                            由此可见,如果人工智能模型的训练方法应用于具体技术领域、与该技术领域中的技术特征密切结合构成了技术手段,并解决了该技术领域中的技术问题,则该方法构成了技术方案,且该方法对应的装置也构成了技术方案。因此,该人工智能模型的训练方法属于专利保护客体的范畴。


                            但在实际研发过程中,提高模型的通用性一直是算法工程师追求的目标。算法工程师总是希望能够提供一种基础算法,以期望自身构建的训练方法能够不限于单一的技术领域,而在其他技术领域也能够表现出不俗的处理效果,此种模型称之为通用模型。通用模型是指能够广泛应用于不同的技术领域,而不限于某一具体的技术领域的泛化模型。可以理解的是,模型的通用程度越高,所涉及的技术领域越广泛。


                            但如果模型的通用程度越高,算法特征就很难与具体技术领域中的技术特征密切结合,就会加大不属于专利保护客体的风险。针对此种情况,一般需要以降低模型的通用性为让步,如将算法的输入数据限定为单一技术领域的具体数据,来降低非保护客体的风险,但是此种方式明显大幅降低了权利要求的保护范围。因此,《专利审查指南》中规定的需要将算法与技术领域紧密结合以满足专利保护客体的要求,与请求保护在实际研发过程中所追求的模型通用性的技术方案之间存在较大冲突。


                            由此可见,有必要对减缓或规避通用模型与专利保护客体之间的冲突进行探讨,实现关于通用模型的权利要求请求保护的方案尽可能满足专利保护客体,以尽可能的为申请人争取较大的保护范围。


                            为了实现上述目的,以下先对专利代理实务中较为常见的几种针对客体问题的撰写方式进行分析。


2结合案例探讨解决策略

                            针对关于通用模型的权利要求请求保护的方案,为了降低非保护客体的风险,一种较为常见的处理方式是将本方案可以应用的技术领域以列举的方式限定在权利要求书中,例如以下权利要求(一)请求保护:

                            (一),一种神经网络训练方法,应用于计算机视觉领域、自然语言处理领域和语音识别领域中的至少一个领域,所述方法包括:

                            通过第一神经网络生成第二神经网络的架构,其中,所述第二神经网络的架构至少包括神经网络的结构和参数;

                            将任务集中包含样本数据的每一个任务输入所述第二神经网络,以训练所述第二神经网络;

                            确定训练后得到的第二神经网络处理任务的准确率;以及

                            通过所述第一神经网络基于所述训练后得到的第二神经网络处理任务的准确率,确定是否更新所述第二神经网络的架构。


                            一种观点认为,在上述权利要求请求保护的方案中,限定了该神经网络训练方法可以应用于计算机视觉领域、自然语言处理领域和语音识别领域中的至少一个领域。在训练神经网络时,可以根据不同的技术领域使用该技术领域中涉及的样本数据。例如,在计算机视觉领域涉及图像数据等,在自然语言处理领域涉及语音数据和/或文本数据等,在语音识别领域涉及语音数据。解决的问题是不同技术领域受限于神经网络本身预先设定好的固有架构,使得训练得到的模型在该技术领域下的实际处理效果差。


                            另一种观点认为,从上述权利要求请求保护的方案中可以看出,该方案除了能反映出输入数据的技术性含义,对于其中涉及的算法的改进仍然是针对抽象算法本身的改进,并不能体现出针对计算机视觉领域、自然语言处理领域和语音识别领域中具有具体物理含义的数据进行处理的特点。上述权利要求请求保护的方案虽然体现了技术领域,但是其主体方案仍然没有与该技术领域中的技术特征紧密结合。从技术三要素出发,该方案仍然无法足够体现技术性。


                            从上述分析来看,持另一种观点的分析似乎更占上风。因此,在权利要求请求保护的方案中仅仅限定多个可以应用的技术领域,对减缓或规避通用模型与专利保护客体之间冲突的作用有限。


                            在代理实务过程中,另一种较为常见的处理方式是不限定具体技术领域,在权利要求书中添加技术特征“由终端或电子设备执行”来增加权利要求中方案的技术性。例如以下权利要求(二)请求保护:

                            (二),一种神经网络训练方法,由电子设备执行,所述方法包括:

                            通过第一神经网络生成第二神经网络的架构,其中,所述第二神经网络的架构至少包括神经网络的结构和参数;

                            将任务集中包含样本数据的每一个任务输入所述第二神经网络,以训练所述第二神经网络;

                            确定训练后得到的第二神经网络处理任务的准确率;以及

                            通过所述第一神经网络基于所述训练后得到的第二神经网络处理任务的准确率,确定是否更新所述第二神经网络的架构。


                            一种观点认为,在上述权利要求请求保护的方案中,电子设备执行了如下操作:生成网络架构、执行任务、确定处理任务的准确率、更新架构,这些操作符合自然规律。解决的问题是现有的电子设备受限于神经网络本身预先设定好的固有架构,使得训练得到的模型实际处理效果差。通过电子设备执行一种神经网络训练方法,按照自然规律完成实施的一系列技术处理,从而获得符合自然规律的训练效果。


                            但另一种观点认为,上述权利要求请求保护的方案虽然通过电子设备来执行和控制,但是其并没有对电子设备的内部性能例如数据传输、内部资源管理等带来改进,也没有给电子设备的硬件构成带来任何技术上的改变,其不构成技术手段。其并不属于审查指南规定的“涉及计算机程序的发明专利申请的解决方案执行计算机程序的目的是为了处理一种外部技术数据,通过计算机执行一种技术数据处理程序,按照自然规律完成对技术数据实施的一系列技术处理,从而获得符合自然规律的技术数据处理效果”情形。


                            此外,持上述不符合保护客体的观点的人进一步认为,对于通用的神经网络训练方法如果获得保护,被申请人独占了通用算法,将限制可能应用到这个算法的所有领域的发展,不符合《专利法》本身的立法本意。


                            从上述分析来看,持另一种观点的分析似乎更占上风。因此,在权利要求请求保护的方案中仅仅限定由电子设备来执行方法,对减缓或规避通用模型与专利保护客体之间冲突的作用有限。


                            在2020年11月国知局公布的《专利审查指南修改草案(第二批征求意见稿)》,第二部分第九章第6.2节审查示例中记载了:利用计算机实施的技术手段的包含算法特征或商业规则和方法特征的发明专利申请,属于专利法第二条第二款规定的技术方案,因而属于专利保护的客体。其中,在第5个示例中记载了如下权利要求(三):

                            (三),一种深度神经网络模型的训练方法,包括:

                            当训练数据的大小发生改变时,针对改变后的训练数据,分别计算所述改变后的训练数据在预设的至少两个候选训练方案中的训练耗时;

                            从预设的至少两个候选训练方案中选取训练耗时最小的训练方案作为所述改变后的训练数据的最佳训练方案;所述至少两个候选训练方案包括至少一个单处理器方案,至少一个基于数据并行的多处理器方案;

                            将所述改变后的训练数据在所述最佳训练方案中进行模型训练。


                            该第二批征求意见稿指出,该方法记载了根据不同大小的训练数据选择适配具有不同性能处理器的训练方案,从而提高系统整体处理性能的内容,利用了计算机实施的技术手段。解决了固定地采用同一种单处理器或多处理器训练方案不适用于所有大小的训练数据而导致训练速度变慢的问题。因此,该发明专利申请的解决方案属于专利法第二条第二款规定的技术方案,属于专利保护的客体。


                            从上述权利要求(三)本身可以看出,在该权利要求中没有限定具体技术领域,训练数据也没有被限定为具有确切物理含义的数据,但在权利要求中限定了训练耗时不同的单处理器方案和多处理器方案,以此来表明该训练方法利用了计算机实施的技术手段。并且,由于该发明专利申请记载了其解决了固定地采用同一种单处理器或多处理器训练方案不适用于所有大小的训练数据而导致训练速度变慢的技术问题,属于对电子设备的内部性能例如内部资源管理等带来的改进。


                            从上述分析来看,在权利要求请求保护的方案中限定利用了计算机实施的技术手段,并在说明书中基于该技术手段定义关于电子设备的内部性能的技术问题,对减缓或规避通用模型与专利保护客体之间冲突具有较大作用。


3本文提出的针对客体问题的撰写策略

                            专利保护客体的审查对象是权利要求书,判断方式是技术三要素,即技术手段、技术问题和技术效果。在确定权利要求中请求保护的方案是否属于专利保护客体时,需要从整体上对权利要求中请求保护的方案进行理解,判断其是否满足技术三要素。而在对权利要求中请求保护的方案进行理解时,需要结合说明书对权利要求书进行解释。


                            目前,对权利要求的解释原则主要分为两种,一种是广义解释权利要求原则,主要适用于确权阶段,指除非说明书中有明确定义外,通过术语的常规含义确定权利要求的保护范围;另一种是修正性解释原则,主要适用于侵权阶段,指当一个授权的权利要求存在保护范围不清楚时,法院通过修正性解释的手段尽量维护已授权权利要求的稳定性。修正性解释原则又包括特别定义解释、普通含义解释和发明目的解释。


                            有观点认为[3],相对于广义解释原则,修正性解释原则在保护客体审查中具有明显的实用性和针对性,它的判断可以基于说明书的语境,更真实地反映技术实质。修正性解释原则中的发明目的解释通盘考虑技术背景、所解决的技术问题、技术方案及技术效果,在理解申请人请求保护的技术方案真实意图基础上全局性、整体性地解释权利要求。


                            本文支持利用修正性解释原则中的发明目的解释来对权利要求进行解释,此种解释原则与通过技术三要素来判断权利要求是否属于专利保护客体更为贴切,更能理解申请人请求保护的技术方案真实意图。


                            在上述背景下,为减缓或规避通用模型与专利保护客体之间的冲突,本文将从说明书和权利要求书两部分分别提出针对客体问题的撰写策略。


                            根据《专利审查指南修改草案(第二批征求意见稿)》中的示例可以得出,对于改进在于算法本身的发明专利申请,如果其方案提高了硬件的运行性能,实现了对计算机系统内部性能的改进,那么可以将某些“改进在于算法本身的发明专利申请”也纳入可以授权的范围。


                            那么,本文针对说明书的撰写建议如下:

                            为了避免从申请文件的本意来看本申请仅是提出一种通用意义上的训练方法,属于针对训练方法本身的改进,可以在背景技术中对数据赋予物理含义,描述背景时可以结合技术领域来描述。在背景技术中定义问题时,可以规避使用算法本身存在的问题作为本申请要解决的问题,以免他人错误的认为本申请的发明本意是仅对算法本身进行改进,而没有任何技术应用场景。在一些情况下,甚至可以在背景技术中不介绍本申请的技术问题,关于本申请的技术问题、技术效果,可以在说明书具体实施方式部分结合采用的具体技术手段来予以详细阐述。


                            在说明书发明内容或具体实施方式中描述由终端执行时能够带来的硬件收益,最好提供模拟训练的对比实施例。硬件收益例如可以是减少数据存储量、减少数据传输量、提高硬件处理速度、提高了终端的智能程度等涉及终端性能的描述。


                            在说明书具体实施方式中可以包括一个或多个描述实际应用场景的单独实施例,针对每个技术领域设计相应的技术性问题。其中,在描述应用场景时,需要描述以下几个方面:应用数据的来源、应用数据如何进行处理、针对该应用场景如何设置迭代条件、从逻辑上推理模型输出的结果如何解决现有技术的问题。需要说明的是,即便数据来源和数据处理等技术方案为常规手段,也需要明确记载,以表明申请人的发明本意是采用相关技术手段解决某技术领域的技术问题。即使后续存在不利于本申请的审查意见,也可以为后续权利要求的修改提供修改基础。


                            本文针对权利要求书的撰写建议如下:

                            首先,独权可以布局由电子设备执行的不带有物理含义的抽象训练方法,即属于上位权利要求。其次,结合计算机技术中处理器和存储器等硬件或软件技术来撰写从属权利要求,即属于中位权利要求。再次,尽可能穷举涉及的技术领域;针对每个技术领域分别布局相应的从权,反映出输入数据和输出数据的技术性含义,即属于下位权利要求。在下位从权中,需要体现具有物理含义的应用数据的来源、应用数据如何进行处理,从而使训练方法与技术领域紧密联系。或者,除上述撰写方式以外,针对可能涉及的每个应用场景,体现具有物理含义的应用数据的来源、应用数据如何进行处理,使训练方法与技术领域紧密联系,分别布局一套权利要求,得到多套独立权利要求。


4结语

                            人工智能领域的专利申请往往与算法等抽象规则和通用方法紧密关联,此类专利申请是否属于专利保护客体一直是业内十分关注的问题,也是研究热点和难点。以上针对说明书和权利要求书的撰写建议,可以用于为减缓或规避通用模型与专利保护客体之间的冲突。


                            但由于对于保护客体的判断有时会受到政策指导的影响,需要时刻关注审查标准的变化,来撰写合适的申请文件。对于客体驳回案件,由于从实审到复审的整个审查周期比较长,审查标准的变化也是客体驳回案件撤驳的转机。


参考文献

                                            [1]王宝筠. 人工智能专利申请的专利保护客体判断[J].中国发明与专利,2021年第4期第18卷,第70~77页.

                                            [2]中华人民共和国国家知识产权局. 专利审查指南[M]. 知识产权出版社,2019年.

                                            [3]吴云. 浅议权利要求解释在保护客体审查中的作用[J].专利代理,2018年第03期,第18~22页.

关注我们

                                    中科专利商标

                                    CSPTAL