-
【技术博客30】- 对抗训练介绍——尝试欺骗一个模型
作者:支广达当我们要实际部署一个机器学习系统的时候,一件非常重要的事情就是系统的鲁棒性,我们希望系统不仅能够对大多数的例子有效,而且要真正的可靠,例如能够识别出别人的攻击(欺骗你的分类模型)。因此近几年对抗鲁棒性(Adversarial Robustness)这个话题引发了广泛的关注。要先改进模型,我们必须知道模型的问题在哪,今天我们就来感受下我们的模型是如何被欺骗的加载模型和样例图片深度学习的魅力之处在于你可以很容易的开始实践然后看到一些在数据上的实际结果。下面我们就来构造我们第一个欺骗...…
-
【技术博客29】- seq2seq聊天机器人
作者:魏祖昌一、背景介绍人工智能技术的进步,语音识别技术、自然语言处理等技术的成熟,智能客服的发展很好的承接当下传统人工客服所面临的挑战。智能客服能够24小时在线为不同用户同时解决问题,工作效率高等特点,这是传统人工客服不能替代的,它能为公司节省大量的人工客服成本。在这次疫情当中,由于总总原因,大家肯定多多少少都见识过各种各样的智能客服。本文就基于seq2seq来介绍一个聊天机器人。二、seq2seqSeq2Seq即Sequence to Sequence,是一种时序对映射的过程,实现了深...…
-
【技术博客28】- K-means:无监督聚类的经典算法
作者:郑培无监督学习是一类用于在数据中寻找模式的机器学习技术。无监督学习算法使用的输入数据都是没有标注过的,这意味着数据只给出了输入变量(自变量 X)而没有给出相应的输出变量(因变量)。在无监督学习中,算法本身将发掘数据中有趣的结构。在监督学习中,系统试图从之前给出的示例中学习。(而在无监督学习中,系统试图从给定的示例中直接找到模式。)因此,如果数据集被标注过了,这就是一个监督学习问题;而如果数据没有被标注过,这就是一个无监督学习问题。聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都...…
-
【技术博客27】- python玩转信号处理与机器学习入门
作者:王镇面对毫无规律的随机信号,看着杂乱无章的振动波形,你是否也像曾经的我一样一头雾水,不知从何处下手。莫慌,接下来小编就带你入门怎样用python处理这些看似毫无卵用实则蕴藏巨大信息的随机信号。我们日常生活中所见的心电图,声波图都是信号在时域上的一种表现,但它们无法呈现出信号在频域上的信息。因此,本文将主要介绍信号从时域到频域上的一些变换,常见的有FFT(快速傅里叶变换),PSD(功率谱密度),auto-correlation(自相关分析)。最后小编将带你完成一个实例,通过手机采集的振...…
-
【技术博客26】- 基于 Python 和 NLTK 的推特情感分析
作者:宋彤彤1. 导读NLTK 是 Python 的一个自然语言处理模块,其中实现了朴素贝叶斯分类算法。这次 Mo 来教大家如何通过 python 和 nltk 模块实现对推文按照正面情绪(positive)和负面情绪(negative)进行归类。在项目内部有可运行的代码教程 naive_code.ipynb 和 经过整理方便进行部署的部署文件 Deploy.ipynb,大家可以结合之前发布的 Mo平台部署介绍 一文学习如何部署属于自己的应用。大家也可以打开下方项目地址,对部署好的应用进行...…
-
【技术博客25】- Python 爬取历史天气数据
作者:梅昊铭 1. 导读之前Mo给大家分享过杭州历年天气情况的数据集,相信有不少小伙伴好奇这些数据是怎么获取。今天Mo就来教大家如何使用Python来进行历史天气数据的爬取。本文的内容只要求大家熟悉 Python 即可,欢迎大家跟着小Mo一起学习。项目地址:https://momodel.cn/workspace/5ea1cd698446abd9da8b73f1?type=app2. 准备工作2.1 目标网站分析在爬取数据之前,我们首先要对爬取的目标网站进行分析,弄清楚爬取的页面和数据在哪...…
-
【技术博客24】- 特征工程介绍
作者:林泽龙1 特征工程是什么?优秀的模型往往取决于优秀的特征提取,而特征提取就需要涉及到特征工程了。特征工程是的目的是最大限度地从原始数据中提取特征以供算法和模型使用。因此特征工程主要是在特征处理方面进行,接下来向大家介绍几种经典和有效的特征工程方法。实践前需要安装sklearn库,它提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。本文中使用sklearn中的IRIS(鸢尾花)数据集来对特征处理功能进行说明。IRIS数据集由Fisher在1936年整理,包含4个特征(Se...…
-
【技术博客23】- 来部署属于你的项目吧
转眼间我们的技术博客栏目也已经发布到第23期啦,小Mo已经为大家介绍了各种领域许多不同的机器学习算法与实现。之前呢,我们的工作人员也与Mo-AI俱乐部的大家做了小小的调研~希望能够做出更多大家想要看到的主题!那第一个就是你啦,非常感谢这位朋友提给我们的意见,今天我们就来看看,在Mo平台上,怎么部署一个训练好的模型,能够方便大家直接调用。1. 新建一个项目在工作台中新建一个项目并进入开发页面,要部署的话,一定是选择新建项目。在当前新建的项目中,点击左侧 Files ,显示了当前工作目录下的文...…
-
版本1.63
新功能: 新增一门官方学习课程 新增notebook边栏收放功能改进: 多处UI界面优化修复: 修复了一些已知问题new function: One new official course Added notebook sidebar retractable functionImprove: Multiple UI optimizationsFix: Fixed some known issues…
-
【技术博客22】- 深度学习新星:图卷积神经网络GCN
作者:金松引言深度学习一直都是被几大经典模型给统治着,如CNN、RNN等等,它们无论再CV还是NLP领域都取得了优异的效果,那这个GCN是怎么跑出来的?是因为我们发现了很多CNN、RNN无法解决或者效果不好的问题——图结构的数据。图片或者语言,都属于欧式空间的数据,因此才有维度的概念,欧式空间的数据的特点就是结构很规则。但是现实生活中,其实有很多很多不规则的数据结构,典型的就是图结构,或称拓扑结构,如社交网络、化学分子结构、知识图谱等等;即使是语言,实际上其内部也是复杂的树形结构,也是一种...…
