-
【技术博客21】- 用Python做中文分词与词云制作
作者:梅昊铭 1. 导读在大数据时代,我们经常在媒体或者网站上看到各种各样的信息图。词云是文本大数据可视化的重要方式,可以将大段文本中的关键语句和词汇高亮展示。对于中文文本的可视化,我们需要先将中文文本进行分词;然后再将文本中的关键词做词云展示。本文将教大家如何使用Python来做中文分词并制作词云,欢迎大家跟着教程一步步实现。项目地址:https://momodel.cn/workspace/5e77afb7a8a7dc6753f582b9?type=app2. 中文分词2.1 分词入门...…
-
【技术博客20】- CNN实现表情识别
作者:魏祖昌一、背景介绍2020年1月29日,教育部有关负责人在接受采访时表示,防控新型冠状病毒肺炎是当前头等重要的大事,各级教育部门正按教育部和当地党委政府统一部署要求,全力防控,坚决防止疫情在学校蔓延,延期开学是其中的一项重要举措。与此同时,各地教育部门也为服务保障防控疫情期间中小学校“停课不停教、不停学”做了大量工作。线上教学随即由此出现了。但是随着网络教学的升入进行,教师不能通过像教室一样能及时的知道学生的学习状态,学生也不会像在教室一样严肃对待学习。既然是线上教学,我们就可以借助...…
-
版本1.59
新功能: 新增两门官方学习课程改进: 第三方登录优化 多处UI界面优化修复: 修复了一些已知问题new function: Two new official coursesImprove: Third-party login optimization Multiple UI interface optimizationsFix: Fixed some known issues…
-
【技术博客19】-文本挖掘之LDA主题模型
作者:郑培引言主题模型是文本挖掘的重要工具,近年来在工业界和学术界都获得了非常多的关注。在文本挖掘领域,大量的数据都是非结构化的,很难从信息中直接获取相关和期望的信息,一种文本挖掘的方法:主题模型(Topic Model)能够识别在文档里的主题,并且挖掘语料里隐藏信息,并且在主题聚合、从非结构化文本中提取信息、特征选择等场景有广泛的用途。Latent Dirichlet Allocation(LDA)是其中最具代表性的模型。LDA由Blei, David M.、Ng, Andrew Y.、...…
-
【技术博客18】CNN网络实现垃圾分类
作者:王镇 Mo1. 背景自2019年7月1日起,随着《上海市生活垃圾管理条例》正式实施,垃圾分类工作在全国由点到面逐步推开。垃圾分类可以最大限度的实现垃圾资源利用,减少垃圾处置量,改善生存环境质量,降低垃圾对于地下水的污染。由于垃圾分类条例刚开始实施,很多居民还没有足够强的垃圾分类意识,生活中垃圾分类并没能得到很好的落实。因此垃圾收集站依然有很强的垃圾自动分类需求。本文通过搭建一个简单的CNN网络实现对垃圾进行自动分类。2. 数据集本文使用的数据集来自kaggle上的垃圾分类数据集,共2...…
-
【技术博客17】基于YOLOv1的视频口罩检测
作者:宋彤彤2019 新冠肺炎疫情爆发,让人们的出行发生了很大的变化——自 1 月 24 日武汉宣布封城之后,各省市陆续启动重大突发公共卫生事件一级响应以控制人口流动。很多城市都已规定必须佩戴口罩、测量体温才能搭乘公共交通。2 月 10 号返工日之前,上海、北京等重点城市也陆续放出新规:出入机场、轨道交通、长途汽车站、医疗卫生机构、商场超市等公共场所,未佩戴口罩者将被劝阻。2 月 13 日,百度飞桨宣布开源业界首个口罩人脸检测及分类模型。基于此模型,可以在公共场景检测大量的人脸同时,把佩戴...…
-
【技术博客16】特征选择和数据可视化
作者:支广达 Mo数据对于我们大多数人来说,都是抽象无序的,今天就让我们来试一试,如何用python将抽象数据可视化为清晰明了的图表吧!对从事算法研究或者数据分析的人来说,数据可视化可能并不是很受欢迎,毕竟数据可视化并不能给研究的内容带来直接的回报,而且制作过程可能比较枯燥,可以说是有点吃力不讨好。但是其实数据可视化可以潜在的让你更加了解你的数据,一个好的数据可视化思路,可以让你在着手自己研究的内容之前,指明方向从而少走弯路。下面我们结合一些例子,来教大家如何巧妙的运用可视化工具对你的数据...…
-
版本1.55
新功能: 新增邮箱账号登录功能修复: 修复了一些已知问题new function: Added email account login functionFix: Fixed some known issues…
-
【技术博客15】利用Logistic函数和LSTM分析疫情数据
作者:林泽龙 Mo1. 背景2019 新型冠状病毒 (SARS-CoV-2),曾用名 2019-nCoV,通用简称新冠病毒,是一种具有包膜的正链单股 RNA 冠状病毒,为 2019 年底出现的新型冠状病毒感染的肺炎疫情的病原。在疫情爆发期间,研究人员对肺炎阳性患者样本进行核酸检测以及基因组测序后发现了这一病毒。如今疫情成了人们最为关心的话题,通过各方的努力疫情也得到了相应的控制,对于疫情的预测许多专业的人士也有不同看法,本文就基于两个简单的模型来预测和分析疫情的数据,当然结果也仅供参考。2...…
-
版本1.50
改进: 优化新手教程导航功能 优化协作同步功能修复: 修复了一些已知问题Improve: Optimized novice tutorial guidance Optimized collaboration synchronization functionFix: Fixed some known issues…
