人工智能

人工智能 · 圈子

648 位酷友已加入

本圈子收集关于人工智能的各种技术资料,加入圈子可以上传、下载资料,也可以使用提问来寻求资料或分享你认为有价值的站外链接~

关注推荐最新

热门标签

资源

【Demo】基于TensorFlow和CNN卷积神经网络实现人脸性别检测

本文主要是实现了根据人脸识别性别的卷积神经网络,并对卷积过程中的提取特征进行了可视化. 卷积神经网络 卷积神经网络最早是为了解决图像识别的问题,现在也用在时间序列数据和文本数据处理当中,卷积神经网络对于数据特征的提取不用额外进行,在对网络的训练的过程当中,网络会自动提取主要的特征. 卷积神经网络直接用原始图像的全部像素作为输入,但是内部为非全连接结构.因为图像数据在空间上是有组织结构的,每一个像素在空间上和周围的像素是有关系的,和相距很远的像素基本上是没什么联系的,每个神经元只需要接受局部的像素作为输入,再将局部信息汇总就能得到全局信息. 权值共享和池化两个操作使网络模型的参数大幅的减少,提高了模型的训练效率. 卷积神经网络主要特点 权值共享: 在卷积层中可以有多个卷积核,每个卷积核与原始图像进行卷积运算后会映射出一个新的2D图像,新图像的每个像素都来自同一个卷积核.这就是权值共享. 池化: 降采样,对卷积(滤波)后,经过激活函数处理后的图像,保留像素块中灰度值最高的像素点(保留最主要的特征),比如进行 2X2的最大池化,把一个2x2的像素块降为1x1的像素块。 卷积网络的训练数据(112×92×3图形) 从data目录读取数据,famale存放女性图片,male存放男性图片 重新打乱 训练集与测试集比例 8:2 训练参数 网络结构 辅助函数 Padding 训练 第一层卷积+池化 第二层卷积+池化 第三层卷积+池化 全连接第一层 全连接第二层 全连接输出层 损失函数 计算准确率&损失 启动会话开始训练 测试集验证 验证通过,保存模型 使用已训练好的模型参考:gender_model_use.py 结果: 迭代3000次,模型的准确率达到93% 训练交叉熵代价 训练的准确率 训练数据中的一个样本 第一层卷积提取的特征 2x2池化后特征 第二层卷积提取的特征 2x2池化后特征 第三层卷积提取的特征 2x2池化后特征 来源https://github.com/chenlinzhong/gender-recognition

计算机

计算机·圈子   首发

侧卫 更新了
资源

2020年中国智能语音行业研究报告-艾瑞咨询

内容 人类对机器语音识别的探索始于20世纪50年代,迄今已逾70年。2016年,在深度神经网络的帮助下,机器语音识别准确率第一次达到人类水平,意味着智能语音技术落地期到来。不过人们面对“AI”时希望得到自然、类人的交互体验,这是一个宏伟的开放性课题,背后涉及的各学科技术仍有不足,还面临长期的求索方能突破。 消费级智能硬件是最早显示出市场潜力的赛道,市场各方都在瞄准消费级智能交互终端。而智能终端的背后还有广阔的生态,包括语音开放平台、语音操作系统、内容等等,近年行业正在经历从单一商业模式向多元化商业模式的变迁,技术输出的“厚度”增加,“边界”扩大,也带来了技术落地曲线的加速度增加。 智能语音企业级和公共级市场主要有平台化技术输出和解决方案两类商业模式,解决方案业务占比较高。与国外市场以医疗为重头有所差异,我国市场以智能客服、公检法及教育业务份额更高。智能语音为各行业解决了刚需性问题,将促进各行业业务效率的提升。 目前全国约有超过250家企业参与智能语音语义市场。互联网巨头、技术提供方、设备商和行业集成商应分别重视连续性投入支持问题、基础开发模块标准化程度提升与商务团队配置问题、设备后服务增长问题和软件研发能力建设问题,迎接人机交互升级带来的行业价值链扩张。 目录 智能语音相关技术概述 子研究(1/3)消费级市场 子研究(2/3)企业级与公共级市场 子研究(3/3)市场参与者 最后 报告来源:艾瑞 发布时间:2020年

计算机

计算机·圈子   首发

侧卫 更新了
资源

2020年中国AI基础数据服务行业研究报告-艾瑞咨询

内容 目前人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了AI的落地程度。 对比中国与世界的发展情形来看,人工智能行业发展前景良好,而作为强关联性的AI基础数据服务行业受其发展红利的影响,未来市场仍有不小的上升空间。 2019年中国AI基础数据服务行业市场规模可达30.9亿元,预计2025年市场规模将突破100亿元,年化增长率为21.8%。 中小型数据供应商的整体体量仍然可观,但随着业务门槛提升、客户需求多样化,越来越多的“中小型数据供应商” 在苦恼生存问题,该群体在未来1-2年内将迎来一阵“倒闭潮”。 “品牌数据服务商” 在这1-2年内应该“居安思危”,注重品牌认可度塑造、提高规模化生产能力、大力发展如预标注、项目进度可视化等精细化运营方式、增加如语音合成(TTS)数据处理等差异化服务,最终追求的是单位价格的利润最大化。 目录 中国及全球人工智能发展概览 人工智能基础数据服务市场现状 人工智能基础数据服务行业壁垒 行业发展机遇与挑战 报告来源:艾瑞咨询 发布时间:2020

计算机

计算机·圈子   首发

阿托 发布了
资源

【项目】人脸编辑生成对抗网络

概述 使用深度神经网络编辑人脸图像。用户可以使用直观的输入(例如草图和着色)来编辑面部图像,网络SC-FEGAN可以从中生成高质量的合成图像。本项目使用了带有门控卷积层的SN-patchGAN鉴别器和类似Unet的生成器。 依赖的第三方库 tensorflow numpy Python3 PyQt5 opencv-python pyyaml 设置 首先,从Google驱动器下载模型。(https://drive.google.com/drive/folders/1VPsYuIK_DY3Gw07LEjUhg2LwbEDlFpq1) 运行这些命令以启动程序。 通过编辑demo.yaml文件选择要使用的GPU数量(不支持多GPU)。 如何使用 使用简单的GUI编辑人脸图像。网络仅填充图像的已擦除区域。 按钮说明 Open Image:打开要编辑的图像。 Mask:在左查看器的脸部所需区域上绘制遮罩。 Sketches:在左侧查看器上绘制所需的线。 Color:绘制彩色线条。如果您第一次单击此按钮,则必须从调色板中选择一种颜色。 Palette: 换颜色。选择颜色后,单击Color按钮以应用更改。 Save Img:保存结果。将其另存为“ name.jpg ”。 Arrange:安排编辑工作。 Undo:撤消以前的编辑工作。 Complete:生成图像并将其显示在正确的查看器上。 建议使用以下工作流程: 参照原始图像合理地画出草图。 在草图区域上绘制蒙版。 点击“安排”按钮。 在蒙面区域上绘制颜色。 点击“完成”。 示例结果 脸部编辑 编辑耳环 面部修复 面部修复(仅草图和颜色) 引用 转载自:https://github.com/run-youngjoo/SC-FEGAN

计算机

计算机·圈子   首发

阿托 更新了
资源

【Demo】开放实体关系抽取

开放实体关系抽取 主要任务 基于依存句法分析,实现面向开放域文本的知识三元组抽取(实体和关系抽取)及知识库构建。 举例 "中国国家主席习近平访问韩国,并在首尔大学发表演讲" 我们可以从句子中提取知识三元组,如下所示: (中国, 国家主席, 习近平) (习近平, 访问, 韩国) (习近平, 发表演讲, 首尔大学) 目录结构 要求 此仓库已在Python 3.5+上进行了测试。 要求是: jieba>=0.39 pyltp>=0.2.1 快速开始 七个DSNF范例 参考 如果使用该代码,请引用以下文章: 贾珊,李敏,向英.中文开放关系抽取与知识库建立[J].计算机应用,2006,26(5):1175-1178 ACM关于亚洲和低资源语言信息处理的交易(TALLIP),2018,17(3):15. 来源https://github.com/lemonhu/open-entity-relation-extraction

资源

【项目】基于Apache Spark的Netflix电影的离线与实时推荐系统

离线推荐 基于Spark MLlib自带的ALS最小二乘法矩阵分解算法 选择的迭代次数iterations=5,物品、用户特征个数K=50 使用了RMSE方法评价推荐精度,结果为0.5757 不同iterations、K值组合下,RMSE值表现 实时推荐 实时推荐算法设计 设计的实时算法的大体思想是: 当用户u对电影p进行了评分,将触发一次对u的推荐结果的更新。由于用户u对电影p评分,对于用户u来说,他与p最相似的电影们之间的推荐强度将发生变化,所以选取与电影p最相似的K个电影作为候选电影。 每个候选电影按照“推荐优先级”这一权重作为衡量这个电影被推荐给用户u的优先级。 这些电影将根据用户u最近的若干评分计算出各自对用户u的推荐优先级,然后与上次对用户u的实时推荐结果的进行基于推荐优先级的合并、替换得到更新后的推荐结果。 注意:由于Netflix Prize数据电影间相似度无法直接计算,这里利用ALS算法的物品矩阵进行cos计算得到各个电影间相似度,详情见Doc下文档 实时推荐延迟测试 下面的数据结果分别是瞬间产生1000、5000、10000、30000、50000个评分数据情况下实时推荐系统的响应时间表现 batchDuration选择了2s 将以上这些测试结果汇总对比如图 保持一定的速度逐渐产生大量评分时实时推荐系统的响应时间表现 a.速度为500个数据量每秒时 横坐标没有数学意义,而是作为每个评分的标识;纵坐标表示了对应横坐标上的评分的实时推荐响应时间,单位为秒。在每秒产生500个评分数据的速率下,实时推荐系统性能良好,最慢的实时推荐也在6s内完成。 b.速度为1000个数据量每秒时 横纵坐标意义同上。从图中可以看到,在每秒产生1000个评分数据的速率下,实时推荐系统性能良好,最慢的实时推荐也在6s内完成。与每秒500个评分的速率下实时表现差不多。 c.速度为1500个数据量每秒时 坐标意义同上。在每秒产生1500个评分数据的速率下,实时推荐系统性能良好,最慢的实时推荐也在5s内完成。与每秒500、1000个评分的速率下实时表现差不多。 d.速度为2000个数据量每秒时 e.速度为2500个数据量每秒时 横纵坐标意义同上。在每秒产生2500个评分数据的速率下,实时推荐系统随着时间推移性能开始下降,这是由于数据堆积产生的问题:当新数据到来时,还有旧数据没有处理完成,造成新数据堆积等待处理,使得被堆积的数据实时响应时间增大。可以看到,在1分钟内实时推荐响应时间逐渐升至20s。可以预见,2500个评分数据/s的速率保持时间越长,实时推荐响应时间越慢。 f.速度为3000个数据量每秒时 项目结构 alsBatchRecommender.scala: ALS离线推荐,以及计算电影间相似度 streamingRecommender.scala: 实时推荐 转载自:https://github.com/LeechanX/Netflix-Recommender-with-Spark

电子

电子·圈子   首发

侧卫 更新了
资源

物联网信号:现状和未来-微软-2020

内容 物联网(IoT)正在改变人们的生活和工作方式。除了你每天使用的智能设备之外,物联网正在彻底改变企业的运营方式 - 让他们变得更快、更智能、更安全、更高效。 随着物联网在全球范围内的不断普及,微软一直走在物联网的前沿,不断地进行创新和投入。《物联网信号》系列报告旨在为业界提供物联网生态系统的整体观点 - 深入了解其应用率以及所带来的益处和挑战。 2019年,微软和Hypothesis展开了物联网引领思想(IoT Thought Leadership)计 划,并制作了几份《物联网信号》系列报告。这些报告的目的是为了更好地服务于我们的合作伙伴和客户,以及帮助企业领导者制定自己的物联网战略,并提供各国和各行业物联网应用的最新研究。 此前的报告主要集中在两轮研究上:2019年2月进行的首轮研究,主要关注各行业的物联网;2019年10月的后续研究,对四个关键行业(能源、制造、医疗和零售)进行了深入研究。 之前的《物联网信号》几波调查覆盖面广、影响大、认可度高,凸显了2020年更新研究的重要性。现在,本次研究在之前的《物联网信号》报告成功的基础上,围绕物联网的现状和未来,提出新的心得和见解。 目录 背景 方法 物联网现状须知 采访的对象——2020年4月/5月 物联网现状:总体研究心得 新兴技术聚焦 (人工智能、边缘计算、数字孪生) 行业聚焦 (制造、医疗、零售、能源) 最后的思考 具体研究目标和受众招募 报告来源:微软 发布时间:2020年

计算机

计算机·圈子   首发

阿托 更新了
资源

【Demo】通过文本制作快速流程图的小应用程序

一个用于通过文本制作快速流程图的小应用程序 用create react app和cytoscape.js制作 主要工作 一个NPM软件包,可从文本文件生成svg。 这对于文档很有用。 将 https://flowchart.fun 转换为PWA,便可安装 添加测试,保证进程不会随着我们前进而中断 如何在本地运行 git clone cd flowchart-fun yarn yarn start 参考: https://github.com/facebook/create-react-app https://github.com/cytoscape/cytoscape.js 来源https://github.com/tone-row/flowchart-fun

计算机

计算机·圈子   首发

阿托 更新了
资源

【Demo】OpenCore引导程序

具有开发SDK的OpenCore引导程序。 Libraries 该存储库还包含由Acidanthera中的其他项目共享的其他UEFI支持公用库。库集的主要目的是为Apple特定的UEFI驱动程序提供补充功能。主要特点: Apple磁盘映像加载支持 苹果键盘输入汇总 Apple PE图像签名验证 Apple UEFI安全启动补充代码 带有屏幕阅读支持的音频管理 基本的ACPI和SMBIOS操作 具有计时器支持的CPU信息收集 加密原语(SHA-256,RSA等) 解压缩原语(zlib,lzss,lzvn等) ACPI的辅助代码读取和修改 文件,字符串,UEFI变量的高级抽象 溢出检查算法 没有UEFI安全启动冲突的PE映像加载 Plist配置格式解析 PNG图像处理 文本输出和图形输出实现 XNU内核驱动程序注入和补丁引擎 该代码库的早期历史可以在HermitCrabs Lab设置的AppleSupportPkg和PicoLib库中找到。 OcGuardLib 该库实现了在项目中建议使用的基本安全功能。它基于NetBSD实现在编译器内置程序,类型对齐检查和UBSan运行时上实现快速安全的积分算术映射。 使用UBSan运行时需要使用Clang编译器和-fsanitize = undefined参数。有关更多详细信息,请参考Clang文档。 来源https://github.com/acidanthera/OpenCorePkg

资源

【项目】短文本聚类预模块

项目介绍 短文本聚类是常用的文本预处理步骤,可以用于洞察文本常见模式,分析设计语义解析规范,加速相似句查询等。查询接口。 依赖库 pip安装tqdm 使用方法 聚类 具体参数设置可以参考cluster.py文件内部_get_parser()函数参数说明,包含设置分词词典,停用词,匹配采样数,匹配度阈值等。 查询 参考search.py代码里Searcher类的使用方法,如果用于查询标注数据的场景,使用分隔符:::将句子与标注信息分段起来。如我是海贼王:::(λx.海贼王),处理时会只对句子进行匹配。 算法原理 文件路径 TextCluster | 自述文件 | 执照 | cluster.py聚类程序 | search.py查询程序 | | ------ utils公共功能模块 | | init.py | | segmentor.py分词器封装 | | 相似度计算函数 | | utils.py文件处理模块 | | ------数据 | | infile默认输入文本路径,用于测试中文模式 | | infile_en默认输入文本路径,用于测试英文模式 | | seg_dict默认分词词典 | | stop_words默认停用词路径 注:本方法仅面向短文本,长文本聚类可根据需求替换SimHash,LDA等其他算法。 文字丛集 介绍 文本簇是分析文本特征的常规预处理过程。该项目仅对短文本集群实现了一种内存友好的方法。对于长文本,最好根据需要选择SimHash或LDA或其他 要求 安装tqdm spacy 用法 聚类 有关更多配置参数的说明,请参阅_get_parser()中的cluster.py,包括停用词设置,样本号。 搜索 基本思想 档案结构 TextCluster | 自述文件 | 执照 | cluster.py集群功能 | search.py搜索功能 | | ------ utils实用程序 | | init.py | | segmentor.py标记器包装器 | | similar.py相似度计算器 | | utils.py文件处理模块 | | ------数据 | | infile默认输入文件路径,以测试中文模式 | | infile_en默认输入文件路径,以测试英语模式 | | seg_dict默认标记器dict路径 | | stop_words默认停用词路径 其他语言 对于其他特定语言,请在中修改令牌生成器包装器./utils/segmentor.py。 转载自:https://github.com/RandyPen/TextCluster#requirements

  • 1
  • 25
  • 26
  • 27
  • 46
前往