向善而生的AI助盲,让AI多一点 ,障碍少一点******
有人说,盲人与世界之间,相差 的只是一个黎明。在浪潮信息研发人员 的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直 是最热门的话题之一。以前,让失明者重见光明依靠的是医学 的进步或“奇迹” 。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破 ,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界” 。
新契机 :多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取 的外界信息中 ,来自视觉 的占比高达70%~80% ,因此基于AI构建机器视觉系统 ,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力 ,无疑是最直接有效的解决方案。
一个优秀 的AI助盲技术 ,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍 的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才 是正确 的新方向和新契机 。
多个模态的交互可以提升AI的感知、理解与交互能力 ,也为AI理解并帮助残障人士带来了更多可能 。浪潮信息研发人员介绍说,多模态算法在AI助盲领域 的应用一旦成熟 ,将能够造福数以亿计的失明者。据世卫组织统计 ,全球至少22亿人视力受损或失明,而我国 是世界上盲人最多的国家 ,占世界盲人总数的18%-20% ,每年新增 的盲人数量甚至高达45万 。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单 ,但多模态算法依然面临重大挑战。
多模态智能算法,营造的 是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一 ,这项研究已经吸引了全球数以万计 的视障患者参与 ,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实 的模型训练数据集。
但是在现有技术条件下 ,盲人视觉问答任务的精度提升面临巨大挑战 :一方面 是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明 、挑选独特颜色 的衬衣 、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时 ,经常会产生虚焦 的情况,可能上传 的照片 是模糊的或者没有拍全 ,或者没拍到关键信息 ,这就给AI推理增加了难度 。
为推动相关研究 ,来自卡内基梅隆大学等机构 的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛 。挑战赛 是给定一张盲人拍摄 的图片和问题 ,然后要求给出相应的答案 ,解决盲人的求助 。
另外 ,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市 ,由于商品外观触感相似 ,很容易犯错,他可能会拿起一瓶醋却询问酱油 的成分表,拿起酸奶却询问牛奶 的保质期等等 。这种噪声干扰往往会导致现有AI模型失效 ,没法给出有效信息 。
最后,针对不同盲人患者 的个性化交互服务以及算法自有 的反馈闭环机制 ,同样也 是现阶段的研发难点 。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点 ,逐光而行 。浪潮信息多模态算法研发团队正在推动多个领域 的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多 的提问就是想知道他们面前 的是什么东西 ,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名 是什么 ?”为此研发团队在双流多模态锚点对齐模型的基础上 ,提出了自监督旋转多模态模型 ,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题 。
盲人所拍摄图片模糊 、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略 ,具备更充分的常识能力,低质量图像 、残缺 的信息 ,依然能够精准 的解答用户 的求助 。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中 的盲人在口述时往往会有口误 、歧义、修辞等噪声 。为此,研发团队首次提出视觉定位文本去噪推理任务FREC ,FREC提供3万图片和超过25万的文本标注 ,囊括了口误、歧义 、主观偏差等多种噪声 ,还提供噪声纠错 、含噪证据等可解释标签。同时 ,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议 ,该会议为国际多媒体领域最顶级会议、也 是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上 ,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA ,同时给出首个智能体交互行为理解算法模型ARE 。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断 、故事续写、剧情推理 、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感 ,但浪潮信息的研发团队 ,却在努力让盲人能“看”到科技的温度 ,也希望吸引更多人一起推动人工智能技术在AI助盲 、AI反诈、AI诊疗、AI灾情预警等更多场景中 的落地 。有AI无碍 ,跨越山海 。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类 ,让更多 的不可能变成可能。当科技成为人 的延伸,当AI充满人性光辉 ,我们终将在瞬息万变 的科技浪潮中感受到更加细腻温柔 的善意 ,见证着更加光明宏大的远方 。
台陈建仁“新内阁”仓促接棒 ,被批“旧瓶装旧酒 ,换汤不换药”******
【环球时报特约记者 陈立非】苏贞昌率领台“行政院”总辞后,陈建仁1月31日正式就任台“行政院长”。不过他同样面临诸多争议 ,如涉嫌论文抄袭 、护航高端疫苗等,如今又被爆 是由“中研院”借调出任新职 ,这些都让岛内舆论对他标榜的所谓“温暖内阁”不抱任何期待 。
“学官两栖”再引争议
1月31日上午 ,台湾地区领导人蔡英文主持新任“行政院长”“总统府秘书长”及政务首长等人员的宣誓典礼 。陈建仁带领宣读誓词 ,他还与卸任 的苏贞昌举行交接典礼 ,并由赖清德监交。
陈建仁在致辞时称,“今天接下印信,承重 的责任就落在肩上 ,战战兢兢 、如履薄冰 ,还不足以形容现在 的心情”。他感谢蔡英文 的信任托付,接下重担他只有一个信念,就 是全力以赴 、没有悬念,每一天的作为都 是为台湾长远未来发展打下坚实基础 ,照顾好人民每日生活 。当天下午,他前往台疫情指挥中心 。台湾联合新闻网称 ,岛内室内口罩松绑预计本周将公布。
苏贞昌在致辞时 ,告诉陈建仁“你 的苦日子要开始啰 !”苏还透露,蔡英文要他还是要接电话,“我顿一下说,放心,处江湖之远 ,我还是会忧其君” 。
尽管陈建仁信誓旦旦要“全力以赴” ,但台媒此前披露称,他其实是从“中研院”特聘研究员借调去出任“行政院长”的。国民党主席朱立伦1月31日表示,这 是历史上从未发生过的 ,陈建仁应该诚恳说明是不 是应该全力以赴为台湾打拼 。台湾《联合报》1月31日发表社论称 ,细数陈建仁的“学官两栖”生涯,其次数之多,令人目不暇接 。他首度借调 ,是在1997年由台湾大学借调出任“国科会”生物处处长 ,25年来从学术界借调至当局任职共计5次 ,前后借调期累计长达12年1个月 。也就是说,25年间有一半的时间都 是借调去当官 。文章说,如今陈建仁已71岁 ,要出掌当局最高行政机器,却还要坚持保留“中研院”特聘研究员49万元新台币月薪的优厚退路,真是名 、利、权一样都不肯放 。而蔡英文办公室能向“中研院”发出这纸名利算尽的借调公文 ,更 是令人瞠目结舌 。
前“立委”蔡正元1月31日还披露称 ,陈建仁的父亲陈新安继承了大笔财产 ,在日本殖民时期属于地主,他得以前往日本就读京都大学,随后还响应日本政府号召成为“皇民化家庭”,并取了日本姓氏“大波” ,因此陈建仁的名字应该 是“大波建仁” 。
旧瓶装旧酒 ,换汤不换药
1月31日,国民党举行“冷血酬庸护高端,检验高冷新内阁”记者会,批评新行政部门换汤不换药 。文传会副主委林家兴直言,“阁员”名单几乎是“旧瓶装旧酒” ,超过七成留任,真正的新人只有5个 ,改组幅度仅约1/4,纯新人更 是只有1/8 ,“这 是哪门子改组 ?实在让民众无法期待”。而且正副“行政院长”都争议不断,蔡英文称陈建仁“内阁”温暖坚韧 ,“难道温暖是护高端弊案?”至于“行政院副院长”郑文灿 ,大撒币却留下诸多粗糙 的公共建设 ,他 的台大硕士学位还因论文抄袭而遭撤销 。国民党“立委”李德维表示 ,陈建仁主张反核,3月核二厂二号机将停止 ,核三厂机组也将在明年及后年停止发电 ,但同时台电亏损不断 ,2025年绿能发电20%确定无法兑现 ,“对于如何解决用电 ,以及电价会不会上涨 ,陈建仁也都应该回答”。
民进党前“立委”沈富雄1月31日形容这次的“内阁”改组,是一出从“狼狈为奸”到“狼狈不堪” 的荒谬连续剧 ,歹戏拖棚终于落幕 ,但蔡英文不 是为大家找到“行政院长”,而 是为她自己找到执行长 。他感叹蔡英文机关算尽 ,虽害不了卿卿性命,却留下荒诞不经的一页 。
台湾中天节目《卢秀芳辣晚报》1月30日进行街访 ,询问民众认为“陈建仁新内阁最大特色 是什么 ?”结果年轻人一面倒,认为最大 的特色就是“败选联盟”,“都是一些没有选好的人上台”,还有人直言 ,“换汤不换药,再做一年也不会有什么效果”。
2.0版“蔡赖内战”
有岛内分析认为,蔡英文之所以选择陈建仁 ,一来是因为他听话,二来 是可以作为一枚活棋 ,牵制民进党主席赖清德,让民进党看看她在2024年选举中还有一定的话语权 。台湾中时电子报称 ,蔡英文显然有意画出一条维持“恐怖平衡” 的界限 ,此举虽然暂时不影响赖清德代表绿营出征2024的格局,但这俨然 是2.0版的“蔡赖内战” ,无论最终 是斗而不破,还是鱼死网破 ,短期内都将让赖清德错失契机。
资深媒体人李晴果1月31日分析称 ,苏贞昌率“阁员”总辞并拍了所谓 的“毕业照” 。尴尬的是,有超过2/3的人拍完照后要走回原来 的办公室继续上班 。外界评论这个被称为史上变动幅度最小 的改组 ,目的就是赶走苏贞昌 。他一定没料到为了说动陈建仁 ,蔡英文什么都可以承诺,更想象不到陈建仁真 的脸皮厚到敢被借调,“蔡英文 的城府之深、手段之强,苏贞昌真的不是对手”。
台湾《中国时报》评论称 ,去年“九合一”选举民进党惨败 ,最受争议 的“农委会主委”陈吉仲、“卫生福利部部长”薛瑞元以及“NCC(通讯传播委员会)主委”陈耀祥通通没换 ,这三人的共同点就 是能揣摩上意 ,让当局变成政治宣传 的化妆台 。
(环球时报)
(文图:赵筱尘 巫邓炎)