单选题:
1.下列聚类算法中, 哪-种算法属于基于网格的聚类算法?(C)
- A CURE
- B DENCLUE
- C STING
- D Chameleon
答案解析
STING,基于网格多分辨率,将空间划分为方形单元,对应不同分辨率;CLIQUE,结合网格和密度聚类的思想,子空间聚类处理大规模高维度数据;WaveCluster,用小波分析使簇的边界变得更加清晰。这些算法用不同的网格划分方法,将数据空间划分成为有限个单元(cell)的网格结构,并对网格数据结构进行了不同的处理,但核心步骤是相同的。
2.机器学习平台PAI的PAI-Studio产品关于项目、实验、表关系描述不正确的是(D)
- A PAI-studio的项目计算是依赖于Maxcompute
- B PAI-studio项目上可以创建多个实验,用来构建算法模型的单位
- C 项目之间可以实现资源、权限的隔离
- D 项目之间的实验和表可以交叉调用
答案解析
PAI-Studio依赖于项目,您可以在每个地域中创建多个项目,以实现资源、权限及实验的隔离与管理(主账号可对子账号进行项目授权)。每个项目中,您可以创建多个实验,用于构建算法模型。离线调度以实验为单位。存储在MaxCompute中,即MaxCompute的数据存储单元。
3.PAI-Studio平台经过读取数据、sql脚本处理、归一化、拆分、模型训练,直到预测,预测输出的列不包括(D)
答案解析
4.机器学习PAI平台上创建AI工作空间有利于管理机器学习应用所需要的计算机资源和人员权限,在创建的过程中,需要开通的AI计算资源包括(A)
答案解析
AI工作空间是PAI产品体系的统一资源和权限的管理模块,您可以在该模块对PAI相关资源(例如DataWorks和MaxCompute)进行购买、升级或降配操作。
5.不需要使用者懂算法,模型训练和优化都是由平台自动完成,0基础即可构建人工智能的应用,的平台工具是(A)
- A PAI-AutoLearning
- B PAI-Studio
- C PAI-DSW
- D PAI-EAS
答案解析
Pai-autolearning适用模型初学者水平人员,主要用来图像分类等模型训练
6.机器学习建模流程可拆分为①模型评估优化、②特征工程、③数据处理、④模型训练四个阶段,这四个阶段的正确执行顺序为?(C)
- A ①②③④
- B ②③④①
- C ③②④①
- D ③④②①
答案解析
在机器学习任务开发过程中,首先需要对数据进行预处理,其次对其做特征工程,接着进行模型训练和评估。
7.在阿里机器学习PAI中,有一个产品是一款云端机器学习开发IDE,能够提供交互式编程环境,适用于不同阶段的开发者并且集成了开源JupyterLab是哪一个(B)。
- A PAI-Studio
- B PAI-DSW
- C PAI-AutoLearning
- D PAI-EAS
答案解析
PAI-DSW是一款云端机器学习开发IDE,提供交互式编程环境,适用于不同阶段的开发者并且集成了开源Jupyterlab,以插件化的形式进行深度定制开发,无需任何运维配置,即可在Notebook进行编写,调试及运行Python代码。
8.如下关于增强学习模型与马尔科夫决策过程的知识描述中,描述错误的是?(B)
- A 增强学习是将智能体置于环境中,通过环境的反馈进行学习,使得智能体的累计收益最大。
- B 若在当前状态已知的条件下,未来状态不仅与当前状态有关,还与所有历史信息相关,则称该状态具有马尔科夫性。
- C 若一系列过程中的每一个事件都具有马尔科夫性,则该系列称为马尔科夫链。
- D 马尔科夫决策过程是在具有马尔可夫性质的环境中智慧形成解决策略的数学模型。
答案解析
当一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态,此性质即为马尔科夫性。
9.AutoLearning是一个自动机器学习平台, 下列选项中,哪一项不属于Autol earning支持的操作?(B)
答案解析
AutoLearning依旧需要上传和手工标注数据,不支持在线自动生成。
10.在pai-studio项目中,新建一个实验时,需要输入实验名称,实验名称的最大长度是(C)个字符。
- A 16
- B 18
- C 32
- D 64
答案解析
pai-studio项目创建实验时,按规范要求,最大长度为32个字符。
11.以下选项描述的场景中,哪个选项可以通过视觉智能技术来实现?(D)
答案解析
人脸识别属于视觉智能的范畴,其他几个都不属于。
12.在机器学习PAI平台上有一个AI工作空间,管理员需要给小张分配一个角色,如果小张是一个程序员,管理员需要给他配置什么角色(B)
- A 负责人
- B 开发
- C 访客
- D 管理员
答案解析
只能进行查看操作。
13.在机器学习PAI平台中,要进行模型开发和训练,是需要准备标注的数据,在PAI中也提供了智能标注功能,该功能目前不支持哪类标注。(D)
- A 图像
- B 文本
- C 视频
- D 动图
答案解析
视频类、文本类、图像类。
14.K-medoids算法是对k-means算法的一种改进算法,如下关于K-medoids算法与k-means算法的描述中,描述错误的是?(C)
- A K-means算法的取值范围可以是连续空间中的任意值
- B K-medoids算法的取值只能是数据样本范围中的样本
- C K-means算法将集群中的中位数作为参考点
- D K-medoids算法是基于最小化所有对象与其参照点之间的相异度之和的原则来进行聚类操作
答案解析
k-mediods每次选取的中心点,必须是样本点,而 k-means每次选取的中心点可以是样本点之外的点,就好比中位数和平均值的区别; k-medoids算法是集群中位于最中心的对象,而不是与k-means一样将集群中的平均值作为参考点。 k-mediods方法仍然可以基于最小化每个对象与其参考点之间的不相似程度之和的原理来进行。
15.以下视觉智能图像目标检测算法中,哪个算法是通过统计和计算图像局部区域的梯度方向直方图来构造特征?(C)
- A FAST
- B DOG
- C HOG
- D Harris
答案解析
方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
16.在一个独立的环境中,进行相关的依赖包配置和第三方包安装后,如果需要把该环境的配置和安装迁移到另外一个独立环境中,应该使用哪种方式最方便(C)
- A 按照之前安装的记忆重新安装
- B 在原环境中查找安装和配置后,在新环境安装
- C 从原环境中导出requirements.txt文件,然后在新环境中安装
- D 无法实现原环境安装和配置
答案解析
requirements.txt文件的作用就是汇总原环境的依赖包信息,便于在新环境中快速移植环境配置。
17.请选择符合指定描述的选项,描述信息为:“应用场景为回归和分类,数据类型为有标签数据,常用的算法为线性回归和支持向量机”(B)
- A 无监督学习
- B 有监督学习
- C 增强学习
- D 半监督学习
答案解析
传统机器学习分为以下几类:
有监督学习(Supervised Learning):每个样本都有对应的期望值,通过搭建模型,实现从输入特征向量到目标值的映射。例如解决回归和分类问题。
无监督学习(Unsupervised Learning):所有样本没有目标值,期望从数据本身发现一些潜在规律。例如解决聚类问题。
增强学习(Reinforcement Learning):相对比较复杂,系统和外界环境不断交互,根据外界反馈决定自身行为,达到长期目标最优化。例如阿尔法围棋和无人驾驶。
18.在机器学习PAI平台上,运行实验结束后,可右键单击画布中的算法组件,在快捷菜单,单击模型选项 ,然后选择哪个项,可查看各因素对成绩的影响权重。(A)
- A 查看模型
- B 保存模型
- C 模型描述
- D 定位模型
答案解析
导出pmml、查看模型、模型描述、保存模型 、定位模型。其中可查看个因素对成绩的影响权重是查看模型。
19.PAI-Studio可视化建模平台支持流批一体训练;封装上百种机器学习算法,拖拽式建模,自动调参,无编程玩转人工智能等。它不能够支持哪些学习(D)
- A 机器学习
- B 深度学习
- C 强化学习
- D 汇编学习
答案解析
PAI-Studio提供的算法组件可以支持传统机器学习、深度学习、强化学习等。汇编学习不属于PAI平台支持的类别。
20.使用阿里云机器学习平台PAI的PAI-Studio进行分类模型训练,要把训练中收入分为低、中、高三档,可以使用以下哪个组件来实现?(D)
- A 拆分组件
- B 特征尺度变换组件
- C 特征异常平滑组件
- D 特征离散组件
答案解析
特征离散是将连续的数据进行分段,使其变为多个离散化区间。针对该场景,PAI推出了分箱组件,支持等频分箱、等宽分箱及自动分箱。
21.下列算法中,哪一项不属于深度学习算法?(C)
- A RNN
- B Fast RNN
- C KNN
- D CNN
答案解析
KNN属于经典的机器学习算法,不是深度学习算法。
22.从因变量的分类角度来看,一个模型的因变量是有序的多分类,这个模型最有可能属于什么类型的模型?(C)
答案解析
有序多分类logistic回归用于因变量为有序多分类的情况,有序多分类logistic回归的假设是,拆分后的几个二元logistic回归的自变量系数相等,仅常数项不等。
23.在机器学习PAI平台的PAI-Studio中,关于自动调参的调参方式有几种方式(A)
- A 7
- B 6
- C 8
- D 5
答案解析
GAUSE、PBT、SAMPLE、EVOLUTIONARY_OPTIMIZER、RANDOM_SEARCH、GRID_SEARCH、UserDefine
24.Pai-studio训练的模型训练完毕之后,可以把模型进行导出,导出的类型为(A)
- A 导出PMML
- B 导出apk
- C 导出mode
- D 导出checkout
答案解析
模型导出类型为PMMI。
25.卷积神经网络中,以下哪一种卷积核大概率不会被用到?(D)
- A 1*1
- B 3*3
- C 5*5
- D 9*9
答案解析
深度学习中常用的卷积核为1*1,3*3和5*5。9*9过大,不适合使用。
26.在PAI-Studio可视化建模创建项目时,会要求依赖阿里云平台上的另外一个产品,该产品是(D)
- A OSS
- B RDS
- C ECS
- D MaxCompute
答案解析
在PAI-Studio创建项目的时候,是需要对MaxCompute形成依赖,如果没有开通,需要进行购买。
27.使用阿里云机器学习平台PAI的PAI-Studio可视化建模构建二 分类模型, 在数据进入模型训练前将数据拆分为两部分,请问此拆分的目的以下描述哪个是正确的?(C)
- A 一部分用于分类1的训练,另一部分用于分类2的训练
- B 一部分用于第1次模型训练,另一部分用于第2次模型训练
- C 一部分用于模型训练,另一部分用于模型评估
- D 一部分用于模型训练,另一部分用于模型优化
答案解析
数据集被划分成训练集和验证集两部分,训练集用于优化模型参数,验证集用于评估模型质量。
28.基于阿里巴巴容器服务ACK的深度学习训练平台PAI-DLC提供了灵活,稳定,易用和极致性能的深度学习环境,下面描述PAI-DLC功能和特点不正确的项(D)
- A PAI-DLC支持数据并行、模型并行及混合并行的分布式方案
- B PAI-DLC融合了PAI在深度学习方面的框架和网络优化技术
- C PAI-DLC支持通过可视化方式提交任务及监控任务进度
- D PAI-DLC无需任何运维配置,即可在Notebook进行编写,调试及运行Python代码
答案解析
PAI-DSW的使用无需任何运维配置,即可在Notebook进行编写,调试及运行Python代码。
29.逻辑回归算法中,可利用Logistic函数归一化输出值,使其取值控制在哪个区间内?(D)
- A [0,1]
- B [0,1)
- C (0,1]
- D (0,1)
答案解析
sigmoid函数也叫Logistic函数,用于隐层神经元输出,取值范围为(0,1),它可以将一个实数映射到(0,1)的区间,可以用来做二分类。
30.在机器学习平台PAI-Studio的数据准备阶段,通过PAI-Studio进行本地数据上传,不可使用的方式有哪些(A)
答案解析
在机器学习平台PAI-Studio的数据准备阶段,通过PAI-Studio进行本地数据上传,可使用PAI-Studio、DataWorks、MaxCompute Tunnel。
31.识别图像中的主体内容并标识内容的类型, 应使用阿里云视觉智能中图像识别的哪种能力?(A)
- A 通用图像打标
- B 元素识别
- C 风格识别
- D 场景识别
答案解析
32.用户在使用阿里云机器学习PAI Studio来对数据进行分类操作时,使用的数据可以存放在如下哪种阿里云产品里?(A)
- A 大数据计算服务MaxCompute
- B 云服务器ECS
- C 数据工场DataWorks
- D BI报表平台Quick BI
答案解析
阿里云机器学习平台PAI使用DataStudio在maxcompute中手动导入数据进行PAI Studio模型的搭建、训练及在线部署调用。
33.使用阿里云机器学习平台PAI的深度学习TensorFlow组件进行模型训练,使用以下哪个组件读取TensorFlow需要的训练数据?(B)
- A 读数据表组件
- B 读OSS数据组件
- C OSS数据同步组件
- D MysqL数据同步组件
答案解析
在使用深度学习框架训练数据之前,需要上传训练的数据至阿里云对象存储OSS中,算法在运行时从指定的OSS目录中读取数据。算法在执行时访问同一区域下OSS中数据时不产生流量费用,访问其它地域的OSS会产生流量费用。
34.在机器学习PAI平台中,创建的PAI-Studio项目,关于GPU选项不包括哪个(C)
- A 不使用
- B 按量付费
- C 按天付费
- D 包年包月
答案解析
不使用、按量付费、包年包月。
35.在机器学习平台PAI中,PAI-DSW实例创建和使用过程有:①进入开发环境 ② 创建/打开Notebook ③ 创建实例 ④模型开发训练,下列选项步骤正确的是(B)
- A ③②①④
- B ③①②④
- C ①②④③
- D ②③①④
答案解析
1. 创建实例 2. 进入开发环境 3. 创建/打开Notebook 4. 模型开发训练。
36.对机器学习的组件进行了封装并且以可视化拖拽的方式进行建模,操作简单,不需要编写代码,用户只需要学习基础的知识,就可以进行建模,使用门槛比较低的平台为(B)
- A PAI-AutoLearning
- B PAI-Studio
- C PAI-DSW
- D PAI-EAS
答案解析
PAI-Studio适用对模型算法有一定了解,通过平台提供的机器学习组件通过拖拽即可进行建模。
37.视觉智能模型训练中,HOG是一种特征点描述算法,算法要对输入图像做颜色空间归-化,其目的以下描述哪个是正确的?(D)
- A 压缩数据量以提升计算效率
- B 确定图像中目标的位置
- C 提升图像的清晰度
- D 降低阴影、光照变化和噪声带来的影响
答案解析
采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰。
38.下列选项中, 哪种算法属于无监督学习算法?(B)
- A K近邻
- B K均值
- C 决策树
- D 逻辑回归
答案解析
k均值算法是无监督学习的一种,主要目的是将待分类样本进行按簇的分类,簇与簇之间的差别尽量大,簇内的差别尽量小,每个簇的中心使用簇中所含值的均值计算而成。
39.在回归分析类型中,因变量有数值型和分类型,其中数值型又分为一个自变量和多个自变量,下面属于一个自变量的算法是(A)
- A 一元线回归
- B 多元线回归
- C 逐步回归
- D 岭回归
答案解析
回归分析类型有数值型,数值型下可按一个自变量和多个自变量分类,一个自变量有一元线回归,多个自变量有多元线回归、多项式回归、逐步回归、岭回归。
40.在回归分析类型中,因变量有数值型和分类型,其中分类型又分为因变量二分类、因变量为有序的多分类、因变量为无序的多分类等,下面属于因变量为无序的多分类算法是(C)
答案解析
回归分析类型的分类型有因变量为二分类、因变量为有序的多分类、因变量为无序的多分类、因变量为多分类同时为配对资料。
41.在PAI-studio产品中创建项目时,选定当前区域后,需要进行依赖检测,主要包括(A)
答案解析
当前账户已完成实名认证和当前账户已拥有Accesskey。
42.在机器学习平台PAI-Studio的数据预处理阶段,常见的数据预处理不包括哪个(A)
- A 清洗
- B 转换
- C 归一化
- D 拆分
答案解析
预处理有采样和过滤、数据合并、类型转换、拆分、归一化、标准化等,清洗是一个统称。
43.如下选项中, 哪一项不属于K-means算法的优点?(B)
- A 原理简单、容易理解、容易实现
- B k值选择对聚类结果没有影响
- C 聚类结果容易解释
- D 聚类结果相对较好
答案解析
k 值对最终结果的影响至关重要,而它却必须要预先给定。 给定合适的 k 值,需要先验知识,凭空估计很困难,或者可能导致效果很差。
44.现使用API调用阿里云视觉智能中图像搜索服务的新增图片接口,以下哪种调用方式最优?(D)
答案解析
支持通过HTTP或HTTPS通道进行请求通信。为了获得更高的安全性,推荐您使用HTTPS通道发送请求。
45.在机器学习PAI平台中,在创建标注任务时,所需要的数据会要求放在指定的产品中,请选择以下哪个产品(A)
- A OSS
- B RDS
- C DSW
- D MaxCompute
答案解析
在机器学习PAI平台中,在创建标注任务时,所需要的数据需要先开通OSS,并把数据上传到bucket中。
46.请选择符合指定描述的选项,描述信息为:“应用场景为关联和聚类,数据类型为无标签数据,常用的算法为K均值和C均值”(A)
- A 无监督学习
- B 有监督学习
- C 增强学习
- D 半监督学习
答案解析
有监督学习:每个样本都有对应的期望值,通过搭建模型,实现从输入特征向量到目标值的映射。例如解决回归和分类问题。
无监督学习:所有样本没有目标值,期望从数据本身发现一些潜在规律。例如解决聚类问题。
增强学习:相对比较复杂,系统和外界环境不断交互,根据外界反馈决定自身行为,达到长期目标最优化。例如阿尔法围棋和无人驾驶。
47.现使用阿里云机器学习平台PAI的PAI-Studio做可视化建模,以下哪个方案可以实现利用存储在阿里云数据库RDS MysqL数据表中的数据训练分类模型?(C)
- A 使用读数据表组件直接读取RDS My sql数据库表
- B 使用读RDS表组件直接读取RDS MysqL数据库表
- C 使用MysqL数据同步组件将RDS MysqL库表同步到MaxCompute,再使用读数据表组件读取数据
- D 使用MysqL数据同步组件将RDS MysqL库表同步到OSS,再使用读OSS数据组件读取数据
答案解析
MysqL数据同步组件将MysqL数据同步至MaxCompute项目。PAI-Studio仅支持通过可视化方式,配置该组件参数。
48.使用阿里云机器学习平台PAI的PAI-Studio可视化建模构建了模型训练实验,希望每天定时使用前一天的数据训练一次,请问PAI支持的哪个功能可以实现上述需求?(C)
答案解析
模型自动调参指的是利用NAS等技术直接完成模型中学习率等超参数的调整;模型在线部署指的是将训练好的模型部署于移动端或者服务端的功能,模型自动特征工程指的是直接对数据进行处理与分析; 离线调度功能是机器学习的常见场景,您需要通过离线调度功能周期性地更新模型,帮助您构建模型训练的Pipline。机器学习支持与DataWorks互通,实现机器学习实验的周期性调度。
49.在机器学习PAI平台上(B)是用户管理表、资源、节点、权限的基本单元并且所有的实验都要归属与它。
- A 表
- B 项目空间
- C 字段
- D 项目
答案解析
所有的PAI实验都需要归属于某个项目空间,项目空间是用户管理、资源、节点、权限等的基本单元。
50.视觉智能模型训练中,使用Harris算法检测特征点。如果窗口向各个方向移动灰度都有剧烈变化,则说明窗口处于图像的哪种位置?(B)
- A 区域边缘
- B 区域角点
- C 区域内部
- D 区域外部
答案解析
在一个平坦区域,在各方向移动,窗口内像素值均没有太大变化; 在边缘特征(Edges),如果沿着水平方向移动(梯度方向),像素值会发生跳变;如果沿着边缘移动(平行于边缘) ,像素值不会发生变化; 在角(Corners),不管你把它朝哪个方向移动,像素值都会发生很大变化。
原文地址:https://www.jb51.cc/wenti/3284181.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。