打工人遇见大模型外面的世界已经这样办公了
机器之心原创
作者:小舟
在办公场景中,制作PPT是最常见的工作之一。工作汇报、产品发布、活动策划、专业讲座等都需要使用PPT。
传统的PPT制作过程枯燥琐碎,耗费时间、精力。特别是将word格式的报告文档转换成PPT,要花费大量时间阅读文档内容、梳理要点,还要精心排版、调整字体图片等等,并且改动word文档PPT就要重新梳理调整。
有没有一种可能,做PPT这件事可以自动化?
在大模型的加持下,百度文库做到了。百度文库在接入文心一言后已从「文档搜索工具」全面重构成「一站式智能文档平台」,涵盖PPT智能生成、文档智能生成、智能编辑、智能辅助阅读等多个功能。
例如,对下面这篇文章,上传word文档,AI就能根据文档内容迅速生成一份直接可用的PPT。
早在今年3月,百度文库就宣布接入「文心一言」,并开启用户内测。8月31日,百度文心一言正式向公众开放,作为行业首个「一站式智能文档平台」,百度文库的「PPT智能生成」等文档创作功能在开放首日就迎来超万人次体验。
为了收获「一站式」的智能创作体验,我们对百度文库新上线的AI功能进行了全面的测试。
PPT智能生成
最近几年,制作PPT越来越卷,各种PPT神器受到大家追捧。但这些制作工具需要按其要求使用,有时甚至会把PPT的制作复杂化。
为了把制作PPT简单化、自动化,百度文库文档助手推出了两种PPT智能生成功能:一句话直接生成PPT和上传word生成PPT。
输入主题直接生成PPT
随着生成式AI取得进展,行业内出现了一些AI生成PPT的工具,其中大部分工具的主要功能就是输入主题生成PPT,例如Gamma。
为了衡量百度文库的生成效果,我们用「生成一个关于恐龙的历史的PPT」这句话,对Gamma和百度文库进行了测试和对比。
Gamma首先生成了一个内容大纲,但最终生成的PPT只有7页,没有目录的展示页:
且PPT内容简单,排版格式也比较单调:
Gamma输入主题生成PPT效果示例。
同样的语句,百度文库首先也是生成内容大纲,但是比较详细,包含两级内容要点:
最终百度文库生成的PPT共24页,从恐龙的特征、演化到恐龙研究的概况,内容丰富完备,排版多样美观,几乎可以直接使用,生成效果和实用价值远超Gamma等PPT工具。
百度文库「输入主题直接生成PPT」效果示例。
上传word生成PPT
相比于输入主题生成PPT,将word文档转换成PPT难度更大。
一方面,解析一句话是模型根据话题进行扩展;而解析一篇文章需要从文章本身的主次结构出发,分析全文的重点要点、行文逻辑、内容风格,对文章进行充分的理解和解构,才能生成合乎文章逻辑、完整丰富的PPT。
另一方面,word文章的质量往往是参差不齐的。有的文章内容非常简单,需要AI模型在生成PPT的过程中加以丰富;有的文章内容复杂、专业,需要AI模型提炼总结,可能还会用到大模型的知识储备。这对大模型的能力提出了更高的要求。
此外,PPT中通常需要一些配图,输入主题生成PPT只需根据主题找到合适的图片;而根据word生成PPT,配图要符合文章主题、段落大意,还要与文章风格适配等等,限制较多。
为了测试百度文库将word文档转换成PPT的能力,我们上传了一篇题为《智能家居技术的前沿发展》的文章:
《智能家居技术的前沿发展》word文档部分截图。
百度文库的文档助手还是先根据word文档的内容生成了一份详细的大纲:
点击「生成PPT」,选择模板后生成了一份36页的PPT:
总体上讲,这份PPT内容丰富、排版美观,整体带有与文章相符的科技感。人工制作这样一份PPT可能至少要花费数十分钟,但AI加持的百度文库只用了大约30秒。
具体来说,PPT在word文档的基础上扩展了很多内容。以「智能照明」为例,word文档中的内容只有短短数行文字:
word文档中关于「智能照明」的全部内容。
而在百度文库生成的PPT中,「智能照明」部分首先介绍了智能照明控制系统和智能照明器具,其次阐述了智能照明市场的规模和发展趋势,然后指出智能照明系统的优势和不足,最后展望了智能照明技术的发展趋势和面临的挑战。
我们发现,百度文库生成的PPT中包含了很多word文档以外的信息。这就需要百度文库借助「文心一言」大模型,对word文档的内容进行深入解析,并生成知识型内容。此外,PPT中的配图也很符合word文章的主题——智能家居,这也需要利用大模型强大的理解能力。
生成带有图表的PPT
数据图表是PPT中常见的一种内容形式,它能够对相关成果进行量化展示,直观清晰。为了测试百度文库能否生成含有数据图表的PPT,我们在文档助手的对话框中输入需求:「生成一份A智能家居公司的财报分析PPT」。
文档助手还是先生成一份PPT大纲,值得注意的是,大纲中不仅有财务数据及分析的内容,还有公司的基本介绍和行业的趋势展望。这说明文档助手了解财报分析PPT的常见用途是什么,并且知道财报分析需要哪些专业数据,例如利润、资产、现金流、总营收等等。
在生成的PPT中,文档助手为不同的财务数据生成了不同类型的数据图表,包括柱状图、折线图、数据表格等,并且每张图表均有文字解读。
例如,总资产详情数据页面包含一张总资产柱状图、一张总资产同比增长率的数据表和一段对总资产变化情况的分析文本。其中,同比增长率是根据总资产数据计算得来。在人工制作财报分析PPT时,同比增长率等数据需要单独计算再添加到PPT中,而百度文库的文档助手借助AI大模型直接生成了全部数据。
如果我们需要对文档助手生成的PPT加以修改,也可以直接让文档助手帮忙操作,例如修改PPT的主题色:
如此一来,制作一份PPT,从需求到成稿大约只需几分钟,办公效率提升的不是一点半点。
动动嘴生成PPT
最后,我们发现上述所有功能在百度文库app上均可使用,并且还有一个额外的功能:动动嘴就能生成PPT,即在移动端百度文库app上我们可以直接语音输入需求,文档助手就能完成生成PPT的任务。
例如,我们语音描述需求:「生成一个介绍玫瑰花的PPT」,百度文库app生成PPT的全过程如下视频所示:
02:25文档智能生成
有了word文档,AI可以生成PPT,而word文档也可以直接AI生成。
我们知道,大语言模型最擅长的任务之一就是文本生成,AI辅助文本创作也是当前大模型最常见的应用方向之一,特别是在办公场景中有着广泛的应用前景。
作为一站式智能文档平台,百度文库已经上线「生成大纲」、「头脑风暴」等多个面向文本的功能,在百度文库中新建文档就可以直接使用这些AI功能。
AI帮你写
为了测试从头开始创作文本的能力,我们用百度文库拟了一份「编辑招聘文案」。
如下图所示,智能生成的结果符合招聘文案格式要求,包括公司简介、职位描述、岗位要求、福利待遇、应聘方式、公司地址几个方面,并根据「编辑」这个具体的岗位展开介绍职位描述和岗位要求。只需根据具体情况调整部分信息就可以实际使用。
然后我们又测试了百度文库的英文写作能力,用中文输入需求:「写一篇英文作文,题目是《秋》」。百度文库生成的文章从秋天的景象写到秋天人们的行为活动,行文流畅、词汇丰富。
写大纲
与招聘文案、电子邮件等办公文本不同,撰写知识型介绍文章往往需要搜集资料、写大纲等前期准备工作。百度文库作为一个收录大量知识型文档的平台,在AI写大纲这个功能可以根据用户提供的主题迅速列出文章的大纲框架。
例如,我们用「茶」这个主题测试了百度文库的「写大纲」功能,生成的大纲框架中包括茶的历史、分类、制作、品鉴、文化、未来几大部分,每部分又细分出几个小节。
头脑风暴
除了拟大纲和写作,在实际的工作生活中,文本创作最关键的一步是寻找思路。基于文心一言大模型的生成能力和百度文库丰富的文档储备,「头脑风暴」这个功能可以为用户迅速找到多个角度。
例如,以「洗发水产品营销方案」为例,「头脑风暴」功能迅速给出了「品牌故事」、「目标市场分析」、「产品特点」、「价格策略」等多个思路。
当然,这些功能也可以在文档助手中直接使用,例如在对话框中直接输入需求:「帮我写一篇产品促销活动策划方案」,文档助手的生成结果如下图所示:
整个文案共包括目标市场分析、促销目的和目标、促销策略制定、促销活动内容、促销执行方案、促销预算和资源需求、促销效果评估和总结七个部分,覆盖了活动策划的各个方面。
值得注意的是,百度文库生成的文本质量很高,完备且详细,这源于百度文库超大规模的高质量文档资源。多年来,百度文库收录内容总量已突破12亿,这让百度文库文档助手在智能文本编辑方面具有独特的优势。
在实际工作中,活动策划、工作报告等文案撰写是极为常见的日常工作。人工完成这些工作可能需要数天时间,而百度文库的文档助手可以又快又好地完成这些任务。看来,只要尽可能详细地描述写作需求,我们就可以用AI辅助完成很多工作任务,工作效率将呈数量级提升。
智能编辑
相比于从头开始创作文本,大模型在编辑文本方面并不擅长。这是因为大模型的生成是比较随机的、生成文本长短不一,而文本编辑要求对文本做出准确、细致的调整,并且往往有字数限制。
当前,大模型在表述完整性和严格字数限制之间,很难做到平衡。模型在训练过程中学习到的知识会影响其输出的字数,而大模型本身输出内容的多样性要求,可能会导致输出不稳定。因此,将大模型应用于文本编辑具备一定的挑战性。
我们发现百度文库目前已经上线多个智能编辑功能,克服了一些技术难点。在百度文库中编辑文档时,选中文档中的段落就会自动弹出「AI智能编辑」按钮,点击会出现一个AI编辑文本的功能菜单,可以对文本进行润色、修订、总结、缩写、扩写、改变语气等。
我们尝试对一段文本进行AI润色,结果如下图所示,一段文本被丰富成两段,文字描述更加细腻:
为了测试AI文本修订功能,我们对原文稍作修改,使其含有语病,句子不通顺,然后选择「词汇语法修订」功能,百度文库AI修订的结果如下图所示:
我们还在百度文库中选择了一篇自动驾驶相关的文章来测试缩写和扩写功能,旨在评估智能编辑对于专业性较强的文章效果如何。
如下图所示,选择缩写功能后,百度文库把两段文字缩写成了一段,并且清楚阐述了原文中重要的概念和因果关系。
在扩写方面,我们发现扩写后的内容添加了「自动驾驶汽车通过激光雷达、摄像头、超声波传感器等设备获取周围环境的信息」等专业表述,这是百度文库根据自动驾驶发展现状延伸扩展的,这说明百度文库已经掌握了一些知识,能够对专业性较强的内容进行智能编辑。
百度文库能够借助AI完成多种文本编辑任务,这说明其已经熟练掌握文本的语法、语义和语言风格等。在实际的文本编写工作中,这样的辅助编辑工具会为我们节省大量时间和精力。
此外,我们还发现文档助手可以根据文本内容生成数据图表:选中含有数据的段落,右侧文档助手就会自动弹出「生成图表」的选项。该功能不仅可以生成数据图表,还会根据文章内容和数据情况作出解析。
例如,我们用一篇《公司财务报表分析案例》中一段涉及销售利润率的段落测试了该功能。结果如下图所示,文档助手生成了一张销售利润率柱状图,并给出了原因分析、解决方案、洞察和建议等等。
智能辅助阅读
在办公场景中,大模型的长文总结能力也具有很多实际用途,例如查阅参考资料、提炼会议记录、速读合同条款等等。
作为一个月活跃用户超过1亿的平台,在百度文库上,以前我们搜索资料通常是用搜索关键词的方法,找到资料后,我们需要粗略查看文献目录和内容,以找到所需信息。
现在,百度文库可以借助文心一言大模型为其收录的文档生成简短的摘要,让用户能够迅速了解文档内容,做到智能辅助阅读,节省办公时间。这让上亿用户在百度文库查阅资料更加方便迅速,成为AI学习办公的「原住民」。
例如,我们让文档助手总结百度文库中一篇题为《人工智能的发展及应用》的长文:
还可以根据文档内容回答相关问题。例如根据该文章回答:「人工智能是何时提出的?」文档助手可以给出正确的回答,并且会指出参照的文章依据是什么。
总结文档内容、回答相关问题等功能也适用于PDF文档。例如,在阅读一篇关于多智能体强化学习的基础和应用的万字长文时,直接选择右侧文档助手中的「帮我总结文档大意」,AI就迅速给出了一份文档内容总结,这样只需几秒我们就能大体了解一篇万字长文的内容。
以秒计时的全新办公模式
今年,生成式AI掀起了一场生产工具变革浪潮。大模型从最初的生成效果惊艳,到开始探索应用方向,再到现在有了一些较为成熟的应用,大模型已经从技术走向落地。文心一言加持的百度文库就是一个很好的例子。
以前,word文档、PPT、搜索工具在办公场景中各司其职,办公往往需要跨平台。虽然内容有很大的相关性,但编写word文档和制作PPT是两项单独的工作,并且每个工作都需要花费较多的时间来完成,例如编写文档就需要搜索资料、构建大纲、撰写文章、润色编辑等步骤。
现在,只需要一句话,百度文库就能生成完备详尽的文档内容,上传文档就能直接生成PPT,整个过程可能只需要几分钟。从这个角度看,百度文库解决了「办公跨平台」这个长期存在的痛点,「一站式」办公成为现实。
那么,百度文库可以给日常工作带来哪些具体的益处呢?
从工作效率上讲,百度文库生成PPT大约需要30秒,创作文档约15秒,总结万字长文只需10秒。其中任何一项任务,人工完成的时间至少是数十分钟,有时甚至需要数天时间。我们可以用节省出来的时间完成更有创新性的工作,制作PPT等相对程式化的工作交给AI来完成,让办公效率呈数量级提升。
从生成质量上看,百度文库生成的内容质量非常高,逻辑清晰、内容丰富,往往只需要人们根据实际情况对生成内容进行调整就可以直接使用。这也是百度文库作为「一站式智能文档创作平台」可以实际应用的重要原因。全面上线仅一个月的时间,百度文库AI新功能的累计用户已超过千万,累计生成内容超0万,累计生成PPT超万。
从使用场景看,以前我们办公通常是依赖于PC端,时空条件有所限制。现在,使用百度文库app,在移动端仅用非常简单的操作就能完成编写文档、制作PPT等任务,打破了办公场景在时间和空间上的限制。
实际上,自大模型崭露头角以来,行业内一直在努力提升大模型的性能,以使其能够投入实际应用。百度文库能成为行业首个一站式智能文档创作平台,来源于三个关键因素。
首先,文心一言大模型基于非常精细的数据训练出了强大的理解能力、生成能力和逻辑能力,这几方面的能力会让其加持的百度文库能够精准理解用户需求、生成内容逻辑清晰、丰富合理。
其次,百度文库本身具有12亿高质量文档,这是百度文库重构的内容优势。这些文档也是文心一言大模型的重要训练数据之一,百度文库和文心一言相辅相成。
第三,百度文库自身的研发团队多年来一直在算法开发、应用落地等层面努力探索。这为百度文库重构为「一站式智能文档创作平台」提供了技术保障。
文心一言问世不过几个月的时间,百度文库已经攻克了多个技术难点,未来还将持续迭代升级。
「我们给自己定的黄金标准就是最可用和最便捷」,百度副总裁、互娱和垂类平台负责人王颖说道。
我们期待看到百度文库上线更多智能创作功能,也期待看到大模型为生产力带来进一步的提升。
转载请注明:http://www.abuoumao.com/hytd/6768.html