Banner
AI视野:OpenAI发布DALL-E3文生图模型;华为发布盘古汽车大模型;《权力的游戏》作者起诉Open侵犯版权

AI视野:OpenAI发布DALL-E3文生图模型;华为发布盘古汽车大模型;《权力的游戏》作者起诉Open侵犯版权

时间: 2023-10-07 07:13:52 |   作者: 半岛体育

产品详情

  

  OpenAI发布了DALL-E3,与ChatGPT完全集成的AI图像合成模型,具有非常出色的文本到图像生成能力,预计将在十月提供给ChatGPT Plus和企业客户。

  1. DALL-E3是OpenAI的最新AI图像合成模型,可以依据文字描述生成高度逼真的图像,通过与ChatGPT的完全集成提供更出色的图像生成。

  2. 这一模型在处理细节和提示保真度方面取得了显著突破,能够更有效地呈现小细节,创建引人入胜的图像,同时还能处理图像中的文本描述。

  3. OpenAI采取了措施来应对争议,包括拒绝要求以特定艺术家风格制作图像的请求,并提供创作者选择不让他们的图像用于未来模型训练的选项。此外,DALL-E3已经实施了关键字和图像检测过滤器,以限制生成不良内容。

  华为在全联接大会2023上发布了盘古汽车大模型和医学大模型,同时推出了昇腾AI云服务的“百模千态”专区。这一举措旨在提供更多领域的大模型应用支持和AI算力服务。

  3、“百模千态”专区包含多个开源大模型,有助于企业和开发者更快地创建自己的大模型应用。

  360宣布360智脑大模型全面接入360全家桶,向公众开放。用户可通过录体验360智脑app、、360安全浏览器、LoRA360、AI数字员工等大模型服务。

  2. 大模型数字人结合知识库,智能识别用户意图,生成高质量AI问答结果。

  奥飞娱乐与图灵儿童GPT合作,推出智娃“超级飞侠•乐迪”版,将超级飞侠乐迪IP融入AI大模型,提供儿童学习与娱乐体验。

  1. 合作升级:奥飞娱乐与图灵儿童GPT深度合作,引入超级飞侠乐迪IP,推出“超级飞侠•乐迪”版智娃。

  2. 一键召唤IP:儿童能够最终靠橱窗点击或扫描相关书籍召唤乐迪,享受与乐迪AI机器人的互动。

  3. 多功能AI机器人:乐迪AI机器人支持陪伴聊天、分享故事、绘本阅读、绘画等多种儿童娱乐与学习功能,提供沉浸式学习体验。

  清华系初创团队水木分子发布了新一代药物研发助手ChatDD,该助手覆盖了药物研发的各个阶段,旨在提高药物研发效率。此外,团队还发布了全球首个千亿参数多模态生物医药对话大模型ChatDD-FM100B,在权威中文基础模型评测中表现出色,达到了医学专业的高水平。

  1、清华系团队水木分子发布了新一代药物研发助手ChatDD,覆盖了药物立项、临床前研究、临床试验的各个阶段,旨在提高药物研发效率。

  2、团队还发布了全球首个千亿参数多模态生物医药对话大模型ChatDD-FM3、100B,在医学领域的评测中表现优异。

  生数科技发布了自主研发的多模态通用大模型,并推出了PixWeaver和VoxCraft两款应用产品。该大模型融合了文本、图像、3D、视频等多模态知识,具备强大的语义理解和训练速度,支持图像生成、3D模型生成和视频编辑。

  1. 生数科技发布多模态通用大模型,融合多种知识模态,提供强大的语义理解和快速训练速度。

  3. 生数科技推出了PixWeaver和VoxCraft应用产品,分别是视觉创意设计平台和3D资产创建工具。

  Xwin-LM是一款基于Llama2微调的语言模型,最近在斯坦福大学的AlpacaEval评估中击败了GPT-4,成为新的榜首模型。Xwin-LM分别推出了70B、13B、7B规模的模型,在多项性能评估和自然语言处理任务中表现出色。AlpacaEval是一款自动评估工具,用于比较模型在遵循指令和性能表现方面的能力,对模型的性能提供了有效的评估方法。

  2. Xwin-LM推出不同规模的模型,在性能评估和自然语言处理任务中表现出色,包括70B、13B和7B规模的模型。

  3. AlpacaEval是一款自动评估工具,用于比较模型的指令遵循和性能表现,尽管有局限性,但为研究人员提供了有效的比较模型能力的方式。

  商汤科技与上海人工智能实验室联合发布了InternLM-20B,一款拥有200亿参数的大模型,性能超越了Llama2-70B,提供全链条工具链并无偿提供商用授权。

  1. 商汤科技和上海人工智能实验室合作发布InternLM-20B,参数达到200亿,性能强大。

  3. 提供全链条工具链,包括数据、预训练、微调、部署和评测,同时提供免费商用授权。

  上海交大生成式人工智能研究组的阿贝尔模型在数学推理领域取得突破,取得多个榜单上的开源模型第一,打破了美国AI公司的霸榜局面。

  1、阿贝尔模型通过有监督精调方法在数学推理领域取得显著成绩,超越了美国AI公司OpenAI和Google等竞争对手。

  2、有监督精调方法是阿贝尔项目的核心,通过精心策划训练数据,帮助模型解决复杂的数学推理问题,展示了其在培养大模型能力方面的巨大潜力。

  3、尽管取得成功,阿贝尔模型仍存在过拟合、泛化性、多语言性等局限性,要进一步改进和拓展,但为国内AI研究团队赢得了国际认可,注入了新的活力。

  一项新的Google搜索更新允许AI生成内容,但网站所有者表示他们的网站排名下降,导致流量大幅度减少。此举引发了广泛的争议,许多人认为Google正在偏向AI生成的内容而不是高质量的原创内容。

  1. Google最近允许AI生成的内容,但这导致许多网站所有者的排名下降,流量大幅减少。

  2. 有人指责Google的更新似乎在偏向AI生成的内容,而不是经过精心编写和研究的原创内容。

  3. 更新旨在提高搜索出来的结果质量,但却引发了网站所有者的不满和争议,他们感到被迫使用AI生成的内容以维持在搜索出来的结果中的可见性。

  乔治·R·R·马丁等《权力的游戏》原著作者与其他知名作家共同起诉OpenAI侵犯版权,指控其没有经过授权使用他们的作品来训练大型语言模型,损害了创作者的生计。

  1. 乔治·R·R·马丁等17位作家起诉OpenAI,指控其没有经过授权使用他们的作品进行大型语言模型的训练,可能会引起侵权作品的生成,对作家市场造成潜在损害。

  2. 诉讼希望被归类为集体诉讼,同时强调OpenAI本能够正常的使用公有领域作品而非没有经过授权的版权材料来训练。

  3. 这是继之前发生的多起生成式AI公司侵权诉讼事件之后的最新一起案件,突显了生成式AI领域的法律挑战。

  智谱AI全资收购清华系大模型公司聆心智能,交易金额几亿人民币左右,提供资金支持和资源整合,保留一定独立性。

  1、智谱AI全资收购聆心智能,交易金额几亿人民币左右,提供资金支持和资源整合。

  3、聆心智能此前与智谱AI合作发布了基于GLM基座的CharacterGLM超拟人大模型,保留独立性继续研究情感陪伴支持的AI技术。

  麻省理工学院的研究表明,多个AI系统辩论问题的答案可以明显提高AI机器人的准确性和推理能力。他们将这一方法称为“多智能体社会”,通过多轮回的响应生成和评论,模型能改善输出结果,类似于团队讨论的结果。

  1、多智能体辩论方法,通过多个AI模型合作来处理问题,提高了AI机器人的准确性和推理能力。

  2、这一办法能够应用于现有的语言模型,如ChatGPT,以改进其输出质量。

  3、在各种基准测试中,多智能体方法在自然语言处理和解谜等领域取得了卓越的成绩,显示了其潜力。

  亚马逊因对AI(AI)滥用担忧,限制自助出版商每日最多发表3本书。尽管出版数量未激增,但他们都以为这举措有助于防止潜在问题,同时发布了内容类型指南,要求创作者通知其关于AI生成内容,以控制AI对出版的影响。

  3、亚马逊发布内容类型指南,要求创作者通知有关AI生成内容,以控制其影响。

  ChatGPT 发布9 个月慢慢的变成了 2023 年最大金矿,大家是怎么靠它挣到钱的?

  ChatGPT在发布9个月后成为2023年最大的金矿,人们通过它赚到了钱。绝大多数生成式AI产品都是新兴的,许多企业自筹资金,且付费意愿强烈。大部分领先产品是从零开始构建的,靠自有模型或微调模型,而不是巨额投资。ChatGPT目前仍然遥遥领先其他生成式AI产品。

  1. 生成式AI产品中,大多数是新兴企业,80%自筹资金,付费意愿强烈,90%已实现盈利,15%筹集至少5000万美元资本。

  2. 领先产品主要是从零开始构建的,有自有模型或微调模型,不需要大笔投资。ChatGPT仍然占据领先地位。

  3. 生成式AI产品中,聊天机器人占据主导,但伴侣AI和内容生成工具也崭露头角,模型中心也表现出色,市场仍在发展中。

  AI生成的内容日益充斥我们的生活,但很难分辨真伪。为提高内容透明度,各平台采取了添加数字水印的方法,以识别和保护AI生成内容。

  1. AI生成的内容泛滥,真伪难辨,导致欧盟预测未来90%的内容将由AI产生或编辑。

  3. 谷歌的SynthID和商汤科技的SenseTrust等工具可以嵌入肉眼不可见的水印,提供内容来源追溯和识别真伪的功能。

  KYP.ai是一家欧洲生产力优化软件初创公司,成功完成了A轮融资,融资总额为1870万美元,由OTB Ventures领投,42CAP和Tola Capital跟投。他们的核心产品是名为Productivity360°的智能管理工具,旨在提升公司生产效率。

  2. 公司的核心产品是Productivity360°,一款帮企业提高生产效率的智能管理工具,通过分析数据和自动化任务来提供优化建议。

  3. KYP.ai计划利用融资扩展其美国业务,并在欧洲和亚洲扩大现有客户群体,推广新的生成式AI模型和工具,为多个领域的客户提供服务,包括技术、保险、医疗保健、公用事业等。

  GitHub宣布将Copilot Chat公测版扩展至个人用户,提供实时编程帮助。用户可通过订阅每月或每年的个人用户费用来体验该功能,提高编码效率和质量。

  2. 开发者可在编写代码时学习新语言、解决错误、获取编程问题答案,无需离开开发环境。

  3. AI编程助手在编程领域的广泛应用为开发者提供更多支持和便利,推动AI技术在编程领域的普及和应用。

  亚马逊生成式 AI 增强语音助手:通过 Alexa LLM 改善智能家居的大脑

  亚马逊的新Alexa语音助手将通过生成式人工智能提供更具对话能力、上下文理解和多重请求响应功能,提升智能家居体验。

  1. 亚马逊揭示了由全新Alexa语言模型(LLM)支持的新Alexa语音助手,旨在通过生成式人工智能提供革命性的改进,使其更灵活、智能化。

  2. 新的Alexa将更好地理解用户的对话,无需过于具体的术语,能够同时响应多个请求,并利用智能家居API提供更多上下文理解,以实现更高级的自动化控制。

  3. 初期,新的Alexa将在美国以预览计划的形式推出,未来可能考虑向别的地方扩展,并可能提供收费的高级功能,使智能家居更强大。

  金山办公宣布WPS AI已接入全线产品,提供全组件AI功能,加强智能办公体验。CEO章庆元强调AI和协作是公司的战略,推出新产品AIGC、Copilot和Insight,同时将AI技术赋能给企业客户,打造一站式协作办公平台。

  2、公司将推出新产品AIGC、Copilot和Insight,加强智能办公体验。

  韩国Daegu科技大学的研究团队成功开发了一种小样本学习模型,能够仅凭少量脑波数据就准确分类人的意图,为脑波研究和应用带来新的可能性。

  1、传统深度学习模型需要大量脑波数据,而新模型能仅使用少量数据便能准确分类脑波,推动了脑波相关研究。

  2、研究团队采用了特征提取、时间注意、聚合注意和关系模块,提高了模型的分类准确性,克服了脑波数据个体差异的挑战。

  3、这一突破有望在医疗和脑机接口领域产生深远影响,为更好理解和应用脑波数据打开了新的可能性。

  GitHub CEO Thomas Dohmke强调AI不会取代研发人员,软件需求将持续增长,包括维护遗留代码和使用生成AI,将继续推动对技术人才的需求。

  1、AI工具如Copilot将提高研发人员的生产力,但不会替代他们,帮他们更高效地工作。

  2、未来十年内,软件数量将指数增长,几乎每家公司都将成为软件公司,增加了对研发人员的需求。

  3、维护遗留代码和使用生成AI将进一步增加对技术人才的需求,而计算机科学专业的学生短缺将使需求不断上升。

  StableSR是一项创新的AI超分辨率方法,利用预训练扩散模型提高图像保真度,与传统方法不同,它通过微调轻量级的时间感知编码器和特征调制层来执行超分辨率任务。该方法引入了可控的特征包装模块和渐进聚合采样策略,以解决扩散模型的随机性,并在任意分辨率下获得一致的输出。

  1、StableSR利用预训练扩散模型增强图像超分辨率,提供了高效的替代方案,不需要从头开始训练模型。

  2、它采用时间感知编码器和特征调制层微调,以提高训练效率和保留生成先验知识。

  3、引入可控的特征包装模块和渐进聚合采样策略,解决了处理任意分辨率的SR任务的挑战,提供了独特的解决方案。

  LayoutNUWA 是一基于大型语言模型的布局生成工具,可以将编码指令转化为出色的网页布局,提高设计效率和吸引力。

  1、LayoutNUWA利用强大的自然语言处理和代码生成能力的LLaMA2-7B和CodeLLaMA-7B模型,自动生成美观的网页布局,减少编程工作。

  2、支持Rico和PubLayNet数据集,用户都能够轻松下载和准备数据,实现自动化布局生成,提高设计效率。

  3、提供模型训练、推理和评估功能,用户可自定义训练参数,获得最佳布局生成模型,有助于设计和开发协同工作。

  1、快速图像抠像:ViTMatte能够在几秒内自动将图像中的前景与背景分离,无需复杂手动操作。

  2、高质量的抠像结果:借助先进的Transformer技术,ViTMatte可以在一定程度上完成高质量的抠像效果,保留细节并减少失线、用户友好的界面:ViTMatte提供简单易用的用户界面,即使对图像处理不熟悉的用户也能轻松上手。

  查看更多相关信息

  《权力的游戏》原著作者乔治·R·R·马丁等知名作家与TheAuthorsGuild等17位作家共同起诉OpenAI侵犯版权的诉讼,成为继前有作家对生成式AI公司提起侵权诉讼后的最新一起案件。OpenAI“擅自、未经允许或未做出考虑地”将原告的作品全部复制,并用于训练大型语言模型。这显示了生成式AI领域的法律挑战愈发突出。

  一群作家,包括迈克尔·查伯恩、大卫·亨利·黄在内,针对OpenAI提起了集体诉讼。OpenAI通过让ChatGPT学习他们的受版权保护作品来进行模型训练,不仅侵犯了版权通过ChatGPT产生的内容分析和总结构成了衍生侵权作品。OpenAI还需就其训练数据的版权问题进行反思,并采取一定的措施避免侵犯作家版权,否则可能难以摆脱持续的版权纠纷。

  本周三,OpenAI宣布了DALL-E3,这是其最新版本的AI图像合成模型,它与ChatGPT完全集成。DALL-E3通过紧密遵循复杂的描述并处理图像内文本生成来渲染图像,这是早期模型所面临的挑战。计划通过API在十月提供给ChatGPTPlus和企业客户,并在今年晚些时候在实验室中提供。

  9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架Megatron-LLaMA,以提高大语言模型训练性能,降低训练成本。蚂蚁集团发布“蚁天鉴”大模型安全一体化解决方案蚂蚁集团在2023国家网络安全宣传周上发布了名为“蚁天鉴”的大模型安全一体化解决方案,包括“蚁鉴2.0”大模型安全检验测试平台和“天鉴”大模型风险防御平台,可以从多角度保障大模型的安全性。sdxl-emoji:

  9月21日凌晨,OpenAI在官网宣布,在今年10月份将通过API向ChatGPTPlus和企业版用户更好的提供全新文本生成图片产品——DALL·E3。ChatGPT在DALL·E3加持下将开启久违的多模态输出模式,用户通过文本就能直接在ChatGPT中生成很多类型图片。从展示能够准确的看出,DALL·E3可以生成写实、二次元、平面、创意、朋克、3D等多种类型的图片。

  微软宣布将在BingChat中引入OpenAI的图像生成工具DALL-E3,通过集成ChatGPT技术,DALL-E3在处理图像内的文本方面表现更出色,用户都能够免费使用该工具。华为发布高性能AI知识库存储解决方案OceanStorA800华为在全联接大会上发布了高性能AI知识库存储解决方案OceanStorA800,针对大模型训练和推理效率瓶颈提供了三大关键能力:超高性能、超快恢复、超强推理。Scalene分析CPU、GPU和内存性能

  OpenAI宣布推出DALL・E3图像生成模型,它的前身是DALL・E2。相比于之前的版本,DALL・E3在理解细微差别和细节方面有了显著提升,能够更准确地将想法转化为图像。OpenAI表示,DALL·E3目前处于研究预览阶段,将于10月份通过API向ChatGPTPlus和企业客户提供,并于今年秋天晚些时候在实验室中提供。

  快手自研文生图大模型“可图”正式亮相。快手宣布在站内短视频评论开始内测AI文生图功能——快手AI玩评,用户都能够通过输入各种创意文字,一键生成海量风格图片,可以更轻松、便捷地在评论区进行趣味互动。可图将会与快手的更多业务开展合作,用AI技术丰富业务的想象力,探索更多有趣、有价值的创新应用落地,让人机共创成为现实。

  核心频率不同,CPU型号不相同天玑9200+和天玑 9000 都是联发科的5G旗舰级芯片,天玑9200+和天玑9000都是采用台积电4nm工艺制程。天玑9200+的CPU最高主频为3.3GHz,而天玑 9000 的CPU最高主频为3.2GHz。两款芯片都支持双模5G、WiFi 6E和蓝牙5. 2 等技术。

  第二代骁龙 8,LPPDR5X+UFS4.0,2K三星E6 材质Super AMOLED屏幕魅族 20 Pro,内置第二代骁龙 8,LPPDR5X+UFS4.0,搭载了2K三星E6 材质Super AMOLED屏幕,屏幕尺寸6. 81 英寸,支持120Hz自适应屏幕刷新率和1500Hz瞬时触控采样率,峰值亮度可达1800nit,屏幕还通过了SGS抗蓝光、抗频闪护眼认证;破晓灰、曙光银、朝阳金三种配色,整机厚7. 8 毫米,重 209 克;镜头模组由 5000 万像素人像镜头、 5000 万像素广角镜头、 5000 万像素超广角镜头组成,支持全像素对焦技术搭配dTOF辅助对焦,官方称将使对焦速度提升33%。魅族20 系列的主摄均支持SMA防抖,最高8K视频录制和夜景录像功能;5000mAh电池配80W快充,支持50W无线GB三种存储组合,售价 3999 起。

  后置三摄,主摄 5000万像素,屏幕分辨率2496*2224华为Mate X3有「羽砂玻璃版:羽砂白、羽砂黑、羽砂紫」、「素皮版:晨曦金、青山黛」五款配色可选;覆盖昆仑玻璃;超轻薄折叠四曲设计,机身重量仅239g,厚度仅5.3mm, IPX8级抗水。屏幕拥有2496*2224超高分辨率和426ppi 超高像素密度。同样支持最高120Hz 自适应刷新率以及1440Hz PWM 调光。影像方面:搭载5000万像素超感知主摄,1300万像素超广角镜头,1200万像素潜望式长焦镜头。并配备10通道多谱传感器和激光对焦传感器,支持100倍变焦和5倍光学变焦。续航方面:配备4800mAh 大电池,支持50W 无线W 有线W 无线反向快充。性能方面:与华为 P60系列一样搭载了骁龙8+ 处理器,配备了超冷跨轴石墨烯散热系统,导热面积提升了20%。价格:华为Mate X3:256GB:12999、512GB:13999;华为 Mate X3典藏版:1TB:15999

  6. 67 英寸的OLED屏幕, 4800 万像素长焦镜头华为P60 系列在背部采用了矩阵型模组,官方称之为“凝光设计”,引入了“凝光贝母”工艺;华为P60 全系搭载了6. 67 英寸的OLED屏幕,拥有2700* 1220 刷新率,显示效果十分细腻,支持10. 7 亿色、1440Hz PWM调光。 同时支持全局色彩管理,支持莱茵专业色准双重认证;屏幕还支持LTPO动态高刷新率,支持1~120Hz自适应刷新率,还配备了昆仑玻璃面板,IP68 防尘抗水;相机方面,华为P60 Pro则进一步升级长焦镜头,配备了 4800 万像素RYYB的超聚光夜视长焦镜头,支持3. 5 倍光学变焦、OIS,拥有F2. 1 超大光圈;支持双向北斗卫星通信;5100 毫安时大电池+88W快充;首发搭载了全新的鸿蒙3.1,新增了AOD息屏显示功能。

  6.67英寸的OLED屏幕,支持1~120Hz的LTPO刷新率华为P60 系列的屏幕搭载了骁龙8+ 4G处理器,6. 67 英寸的OLED屏幕,支持1~120Hz的LTPO刷新率,支持1440Hz PWM调光,拥有10. 7 亿色、全局P3 色域、HDR-P3HDR Vivid显示效果;覆盖四曲昆仑玻璃,支持IP68 防水,是全球首款德国莱茵专业色准双重认证的手机;相机方面,华为P60 支持F1.4-4. 0 十档可变光圈,搭载大光圈高透光镜群和RYYB超感光传感器,支持了华为XD Fusion Pro质感引擎;支持双向北斗卫星消息;首发搭载鸿蒙3.1,支持AOD息屏显示;价格,华为P60 的128GB版 4488 元,256GB版本是 4988 元,512GB版本是 5988 元。

  天玑9000芯片,LPDDR5+UFS3.1,11.61英寸LCD屏幕,支持144Hz刷新率OPPO Pad2主要配置包括:11.61英寸7:5比例LCD显示屏,拥有2800×2200分辨率和500尼特亮度,支持144Hz五档刷新率智能调节,2048级亮度自适应智能调光并支持手写笔。OPPO Pad2基于联发科技天玑9000,辅以LPDDR5内存和UFS3.1存储,内置9510毫安时电池、67W有线万像素前置摄像头和蓝牙5.3。软件方面,ColorOS13.1支持5G通信共享。可以自动共享手机的5G通信,从而直接上网、接打电话、同步手机验证码、拍照流转和应用接力。

  5G双待双通(DSDS)、WiFi 6/6E、蓝牙5.3等骁龙7+ Gen2 采用了骁龙X62 5G调制解调器,在全世界内支持多种频段和模式的5G网络连接。它还是首款在骁龙 7 系中实现了5G双待双通(DSDS)功能,在两张SIM卡都插入时可以同时使用两个不同运营商或不同网络制式(例如SA和NSA)的5G网络服务。除此之外,它还支持WiFi 6/6E和蓝牙5. 3 等无线技术。