点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

首页> 科技频道> 综合新闻 > 正文

金博娱乐账号注册: 把文本变成画作,AI对艺术“下手”了

来源:科技日报2021-02-01 10:05
本文来源:http://www.662ib.com/www_deyi_com/

188申博直属现金网登入,3:双烤双烤是将CPU和独立显卡两大部件高负荷下运行,将cpu和独立显卡温度达到最高。五是有一些经济的景气指数逐步向好,PMI回到了荣枯线以上,3月份达到了50.64%,结束了七个月位于临界点以下的状态。因此,‘坏广告’的泛滥也就不足为奇了。付强坦承,手持业内仅有的数张牌照,但仍觉得缺乏资源,“做投入很大,但国企又不太允许亏钱。

可以看到随着超极本的崛起,厂商的设计理念发生了变化,SONY经典Z系列的消亡就反应了这个趋势:轻薄本就主打续航和便携,性能什么的交给一般本来做就好了,于是有了pro13,thinkpad的X1也是这个思路。【新片预热】《最佳前男友》言承旭再演霸道总裁,江疏影演活“变态女”;《新萧十一郎》古龙经典全新演绎,甘婷婷美艳引猜想【热门电影】左耳,玩的就是艳遇,万物生长,我是女王,钟馗伏魔:雪妖魔灵,贵族大道,天将雄师,何以笙箫默,咱们结婚吧【热门电视剧】二胎时代,制片人,神犬小七,少年神探狄仁杰,拥抱星星的月亮,花千骨,克拉恋人,华胥引、盗墓笔记【热门动漫】萌萌哒联盟,新大头儿子小头爸爸,海贼王,熊出没之丛林总动员,火影忍者OVA第6部,黑子的篮球,蜡笔小新,黑猫警长,勇者大冒险,贝瓦儿歌,名侦探柯南【热门综艺】咱们穿越吧,我去上学啦,偶像来了,蒙面歌王,真心英雄,咱们穿越吧,中国好声音第四季、爸爸去哪儿第三季、极速前进第二季、极限挑战,快乐大本营,天天向上【功能亮点】√高清播放:全网高清资源流畅播放,轻松体验视觉盛宴!√离线观看:随时随地尽情享受大片,再也不用纠结流量!√权威热榜:最权威的视频排行榜,热门看点一手掌握!√播放升级:常用视频格式全部支持!【全新推出】√全新设计:导航更清晰,操作更简单,界面更清新√播放历史:增加播放历史提示,追过的剧一集也不错过!√性能优化:全面优化缓存成功率,优化页面加载性能,打开页面更快更省流量,优化启动速度。  超次元AR还有一个亮点就是有丰富的人物和角色资源,从经典的皮卡丘到人气二次元角色都可找到,而且玩家还可对角色进行拓展和个性化设置,玩法丰富和多样化,遗憾的是,有些人气角色并不支持网上下载,玩家需要自行到实体店或者淘宝购买对应的AR卡片。该机拥有三个版本,价格方面,spanspanlang=EN-US3GB32GBspanspanstyle=font-family:宋体;(全网通spanspanlang=EN-USspanspanstyle=font-family:宋体;运营商版本)为spanspanlang=EN-US1999spanspanstyle=font-family:宋体;元,而spanspanlang=EN-US4GB32GBspanspanstyle=font-family:宋体;、spanspanlang=EN-US4GB64GBspanspanstyle=font-family:宋体;均为全网通版本,售价分别为spanspanlang=EN-US2299spanspanstyle=font-family:宋体;元与spanspanlang=EN-US2499spanspanstyle=font-family:宋体;元。

而伴随2016一起终结的还有智能手表中最漂亮的一款Moto360。其次,支持林业与电子商务相结合,通过林产业大宗电子交易平台的建立,形成林产品集中式的在线交易,进而构建销售新模式。  地处中国东北、沿边近海的吉林省多年来一直在“望海兴叹”。”朱彦透露,这些工作现在都在进行中,需要经过包括先期仿真分析在内的很多试验、验证。

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  图为人工智能系统 DALL·E根据文本“穿着芭蕾舞裙遛狗的小萝卜”绘制的图像。图片来源:OpenAI官网

  自然语言处理与视觉处理,都重在对不同模态数据所包含的语义信息进行识别和理解,但是两种数据的语义表现形式和处理方法不同,导致存在所谓的“语义壁垒”,现在这种壁垒正在被AI打破。

  1月初,美国人工智能公司OpenAI推出两个跨越文本与图像次元的模型:DALL·E和CLIP,前者可以基于文本生成图像,后者则可以基于文本对图片进行分类。这个突破说明通过文字语言来操纵视觉概念现在已经触手可及。自然语言处理和视觉处理的边界已经被打破,多模态AI系统正在逐步建立。

  “数据的来源或者形式是多种多样的,每一种都可以称为一种模态。例如图像、视频、声音、文字、红外、深度等都是不同模态的数据。单模态AI系统只能处理单个模态的数据。例如对于人脸识别系统或者语音识别系统来说,它们各自只能处理图像和声音数据。”中国科学院自动化研究所副研究员黄岩在接受科技日报记者采访时表示。

  相对而言,多模态AI系统可以同时处理不止一种模态的数据,而且能够结合多种模态数据进行综合分析。“例如服务机器人系统或者无人驾驶系统就是典型的多模态系统,它们在导航的过程中会实时采集视频、深度、红外等多种模态的数据,进行综合分析后选择合适的行驶路线。”黄岩说。

  不同层次任务强行关联会产生“壁垒”

  就像人类有视觉、嗅觉、听觉一样,AI也有自己的“眼鼻嘴”,而为了研究的针对性和深入,科学家们通常会将其分为计算机视觉、自然语言处理、语音识别等研究领域,分门别类地解决不同的实际问题。

  自然语言处理与视觉处理分别是怎样的过程,二者之间为什么会有壁垒?

  语义是指文字、图像或符号之间的构成关系及意义。“自然语言处理与视觉处理,都重在对不同模态数据所包含的语义信息进行识别和理解,但是两种数据的语义表现形式和处理方法不同,导致存在所谓的‘语义壁垒’。”黄岩说。

  视觉处理中最常见的数据就是图像,每个图像是由不同像素点排列而成的二维结构。像素点本身不具有任何语义类别信息,即无法仅凭一个像素点将其定义为图像数据,因为像素点本身只包含0到255之间的一个像素值。

  “例如对于一张人脸图像来说,如果我们只看其中某些像素点是无法识别人脸图像这一语义类别信息的。因此,目前计算机视觉领域的研究人员更多研究的是如何让人工智能整合像素点数据,判断这个数据集合的语义类别。”黄岩说。

  “语言数据最常见的就是句子,是由不同的词语序列化构成的一维结构。不同于图像像素,文本中每个词语已经包含了非常明确的语义类别信息。而自然语言处理则是在词语的基础上,进行更加高级的语义理解。”黄岩说,例如相同词语排列的顺序不同将产生不同的语义、多个句子联合形成段落则可以推理出隐含语义信息。

  可以说,自然语言处理主要研究实现人与计算机直接用自然语言进行有效信息交流,这个过程包括自然语言理解和自然语言生成。自然语言理解是指计算机能够理解人类语言的意义,读懂人类语言的潜在含义;自然语言生成则是指计算机能以自然语言文本来表达它想要达到的意图。

  由此可以看出,自然语言处理要解决的问题的层次深度超过了计算机视觉,自然语言处理是以理解人类的世界为目标,而计算机视觉所完成的就是所见即所得。这是两个不同层次的任务。目前来说,自然语言处理在语义分析层面来说要高于视觉处理,二者是不对等的。如果强行将两者进行语义关联的话,则会产生“语义壁垒”。

  AI打破自然语言处理和视觉处理的边界

  此前,OpenAI斥巨资打造的自然语言处理模型GPT-3,拥有1750亿超大参数量,是自然语言处理领域最强AI模型。人们发现GPT-3不仅能够答题、写文章、做翻译,还能生成代码、做数学推理、数据分析、画图表、制作简历。自2020年5月首次推出以来,GPT-3凭借惊人的文本生成能力受到广泛关注。

  与GPT-3一样,DALL·E也是一个具有120亿参数的基于Transformer架构的语言模型,不同的是,GPT-3生成的是文本,DALL·E生成的是图像。

  在互联网上,OpenAI大秀了一把DALL·E的“超强想象力”,随意输入一句话,DALL·E就能生成相应图片,这个图片内容可能是现实世界已经存在的,也可能是根据自己的理解创造出来的。

  此前,关于视觉领域的深度学习方法一直存在三大挑战——训练所需大量数据集的采集和标注,会导致成本攀升;训练好的视觉模型一般只擅长一类任务,迁移到其他任务需要花费巨大成本;即使在基准测试中表现良好,在实际应用中可能也不如人意。

  对此,OpenAI联合创始人曾发文声称,语言模型或是一种解决方案,可以尝试通过文本来修改和生成图像。基于这一愿景,CLIP应运而生。只需要提供图像类别的文本描述,CLIP就能将图像进行分类。

  至此,AI已经打破了自然语言处理和视觉处理的边界。“这主要得益于计算机视觉领域中语义类别分析方面的飞速发展,使得AI已经能够进一步进行更高层次的视觉语义理解。”黄岩说。

  具体来说,随着深度学习的兴起,计算机视觉领域从2012年至今已经接连攻克一般自然场景下的目标识别、检测、分割等语义类别分析任务。2015年至今,越来越多的视觉研究者们开始提出和研究更加高层的语义理解任务,包括基于图像生成语言描述、用语言搜索图片、面向图像的语言问答等。

  “这些语义理解任务通常都需要联合视觉模型和语言模型才能够解决,因此出现了第一批横跨视觉领域和语言领域的研究者。”黄岩说,在他们推动下,两个领域开始相互借鉴优秀模型和解决问题的思路,并进一步影响到更多传统视觉和语言处理任务。

  多模态交互方式会带来全新的应用

  随着人工智能技术发展,科学家也正在不断突破不同研究领域之间的界限,自然语言处理和视觉处理的交叉融合并不是个例。

  “语音识别事实上已经加入其中,最近业内出现很多研究视觉+语音的新任务,例如基于一段语音生成人脸图像或者跳舞视频。”黄岩说,但是要注意到,语音其实与语言本身在内容上可能具有较大的重合性。在现在语音识别技术非常成熟的前提下,完全可以先对语音进行识别将其转换为语言,进而把任务转换为语言与图像交互的常规问题。

  无论是DALL·E还是CLIP,都采用不同的方法在多模态学习领域跨出了令人惊喜的一步。今后,文本和图像的界限是否会被进一步打破,能否顺畅地用文字“控制”图像的分类和生成,将会给现实生活带来怎样的改变,都值得期待。

  对于多模态交互方式可能会带来哪些全新应用?黄岩举了两个具有代表性的例子。

  第一个是手机的多模态语音助手。该技术可以丰富目前手机语音智能助手的功能和应用范围。目前的手机助手只能进行语音单模态交互,未来可以结合手机相册等视觉数据、以及网络空间中的语言数据来进行更加多样化的推荐、查询、问答等操作。

  第二个是机器人的多模态导航。该技术可以提升服务机器人与人在视觉和语音(或语言)方面的交互能力,例如未来可以告诉机器人“去会议室看看有没有电脑”,机器人在理解语言指令的情况下,就能够结合视觉、深度等信息进行导航和查找。(记者 马爱平)

[ 责编:赵宇豪 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 博鳌亚洲论坛2021年年会盘点

  • 浙江诸暨一事一议助力美丽乡村建设

独家策划

推荐阅读
中国石化表示,作为国内最大的合成树脂生产商,将发挥牵头引领作用,联合上下游产业打造塑料循环经济新模式。目前,中国石化已实现生物可降解塑料工业化生产,广泛应用于一次性日用品、包装材料、农用薄膜、3D打印线材、医用材料等领域。
2021-04-22 09:44
在这个时期,如果将其他物种的干细胞注射到这些细胞附近,这些异种细胞就有可能随之一起发育,形成嵌合胚胎。利用这种全能干细胞可诱导原始生殖细胞的特点,将其用于濒危物种的保护与繁衍,是研究的另一重要亮点。
2021-04-22 09:44
绿孔雀被称为“百鸟之王”,是我国一级重点保护动物,被国际自然保护联盟评定为“全球性濒危”等级。绿孔雀体态优美、羽色华丽,是中国文艺作品中常见的主角,在东亚和东南亚的传统文化中也占有重要地位。
2021-04-22 09:43
此后,科研人员又相继培育出适合赤道地区生长的16个大豆新品种,使巴西成为世界上第一个在低纬度地区大规模种植大豆的热带国家。法比奥指出,现在巴西80%大豆使用转基因技术,对巴西提高大豆单位产量发挥了重要的作用。
2021-04-22 09:38
英国《自然·通讯》杂志20日发表一项健康新研究,法国科学家团队追踪调查了近8000名成人逾25年,发现中年时期每晚睡眠时长经常少于6小时与更高失智风险有关。
2021-04-22 09:37
美国哈佛大学研究人员领导的一项新研究表明,打屁股不仅仅是体罚,更可能会影响儿童的大脑发育。该研究也存在一定局限性,例如无法量化孩子被打屁股的严重程度,且孩子被惩罚的自主反应有可能被漏报。
2021-04-22 09:36
从体育场外盖到太阳帆,工程师们利用可折叠设计构建了许多大型结构,这些结构甚至可以快速压缩到其尺寸的四分之一。在此之前,折纸原理其实已广泛应用于机器人领域,现今的新成果,无疑将为未来更加实用的大型充气结构奠定基础。
2021-04-22 09:34
英国政府20日公布的第六个碳预算宣布了其最新减排目标,即到2035年,二氧化碳排放量将比1990年的水平减少78%。英国首相鲍里斯·约翰逊表示,这比此前碳排放量在2030年减少68%的目标有所提高。
2021-04-22 09:33
1秒钟跑出自身长度数十倍的距离,是很多细菌具有的运动能力。联合团队经过解析发现,鞭毛马达含有质子泵,可通过转运氢离子,带动质子泵的转动,将化学能转变为机械能,继而将扭矩传给鞭毛马达的内膜环,促使内膜环的转动。
2021-04-22 09:31
我国科技工作者花了几十年时间,在滨海滩涂上筛选出一种耐盐碱先锋植物——盐地碱蓬,已在我国内地盐碱荒漠上种植获得成功。“在重度盐碱地和盐碱荒漠上种植盐地碱蓬,有一个意想不到的陆地生态与环境的观赏景观式变革:具有生态价值、环境价值和观赏价值。
2021-04-22 09:30
国家教育行政学院副院长于京天指出,未来教育应该是人与技术相融合、相协调的教育,技术介入教育必须充分考虑与人的相关性,立足于真实的个性化需求。清华大学附属中学校长、清华大学教授王殿军希望,技术能够帮助解决教育中最关键、最核心的问题——教育评价问题。
2021-04-22 09:29
4月20日,科技日报记者走进广东先导先进材料股份有限公司,映入眼帘的是“国家稀散金属工程技术研究中心”“国家认定企业技术中心”等牌匾。目前,研究院已引进中科院院士、长江学者、国家杰青等国家高层次人才领衔的创新创业团队18个,其中孵化科技企业9家,转化科技成果33个。
2021-04-22 09:23
近日,科技部组织召开“碳中和科技创新路径选择”香山科学会议,国内能源、工业、交通、建筑等领域碳减排和生态碳汇方面的近百位院士和高层专家参会,就碳达峰碳中和科技创新路径进行研讨。
2021-04-22 09:23
“百年胜利展望”科技创新论坛的召开,吸引了一批来自天南地北的院士“大咖”,中国科学院贾承造院士、金之钧院士,中国工程院曹耀峰院士、李阳院士、李根生院士、郭旭升院士、顾心怿院士……现身会场的众多院士身上有个共同的标签:石油人。
2021-04-22 09:20
记者采访胜利油田前后跨越10多年,对其60年发展史了解得越多,就对一句话体会越深:掌握创新的核心技术是胜利油田的“不老秘诀”。一线现场出题,科研人员答题,工程人员落地;产石油,育人才,出技术,三者相辅相成,它们支撑着胜利油田青春了60年。
2021-04-22 09:19
作为5G产业链中最重要的技术环节之一,5G芯片的研发和制造一直备受全球关注。与此同时,它还有新一代的低功耗设计架构、基于AI的智能调节技术,相比外挂5G方案能效全面胜出,部分数据业务场景下功耗降低多达35%。
2021-04-22 09:18
“项目获批是对我们创新能力的认可和肯定,同时也是对SY-5007先进性的肯定,获得拨款将加快项目推进速度,助力该药早日上市。”首药控股董事长李文军表示,接下来,首药控股将充分发挥科研优势,更高质量、更高水平推出抗癌创新药。
2021-04-21 18:24
据《日经亚洲评论》18日最新消息,美国总统拜登和日本首相菅义伟同意共同投资45亿美元,开发被称为6G或“超越5G”的下一代通信技术。在5G专利方面,美国领军企业高通拥有约10%的专利,与华为持平,但日本最大的厂商NTT Docomo只有约6%。
2021-04-21 09:36
广东石化炼化一体化项目是中国石油迄今为止一次性投资建设规模最大的炼化一体化项目,可实现2000万吨/年炼油、260万吨/年芳烃、120万吨/年乙烯,其中260万吨/年芳烃联合装置是目前全球单套生产能力最大的芳烃装置。
2021-04-21 09:34
“这就好比每个安装稀土SCR催化剂的汽车都成了过滤器,汽车尾气经过治理后,排出的气体完全符合排放标准。通过测算,使用这项具有自主知识产权的稀土SCR催化剂,相比国外催化剂能够节约成本10%—20%。
2021-04-21 09:34
加载更多
太阳城娱乐网址 申博支付宝充值 旧版太阳城申博现金直营网 申博现金网登入 www.333msc.com 菲律宾申博娱乐现金网
太阳城官方直营网登入 申博苹果手机下载 申博管理网登入 菲律宾申博官方网址登入 旧版太阳城直营网 申博现金百家乐登入
申博太阳城官方现金直营网 申博真人游戏登入 申博游戏注册登入 www.91tyc.com 申博官网太阳城娱乐网 太阳城娱乐138申博直营网