博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
spark 机器学习
阅读量:6938 次
发布时间:2019-06-27

本文共 432 字,大约阅读时间需要 1 分钟。

 

 

 

val rawData = sc.textFile("/user/zhaoja/test/input/xxt.txt")val data = rawData.map { line =>val values = line.split(',').map(_.toDouble)//创建向量val featureVector = Vectors.dense(values.init)val label = values.last - 1//含有类标签的点LabeledPoint(label, featureVector)} scala> data.take(1)res70: Array[org.apache.spark.mllib.regression.LabeledPoint] = Array((0.0,[9.0,21.0,3.0,4.0,5.0]))

 

转载于:https://www.cnblogs.com/huanhuanang/p/7373680.html

你可能感兴趣的文章
Python使用xslt提取网页数据
查看>>
磨刀霍霍:爬爬爬爬爬爬虫爬起来~
查看>>
记录vuex module 模块化分割
查看>>
预防cdn链接失效,无缝切换本地文件
查看>>
有赞订单导出的配置化实践
查看>>
hexo 搭建博客
查看>>
[LeetCode] 491. Increasing Subsequences
查看>>
正则表达式-入门
查看>>
Weex学习指南
查看>>
ES6 系列之我们来聊聊 Async
查看>>
读书笔记:执行上下文(Execution Context)
查看>>
【1024程序员节】程序员,你学编程的初衷是什么?
查看>>
「Do.016」AndroidStudio不用编译,阅读Android源码
查看>>
《Java编程思想》笔记7.复用类
查看>>
RubyMine ( IntelliJ 通用 ) 编辑 Slim + Vue.js 遇到文件无法打开的坑
查看>>
ECMAScript7规范中的ToPrimitive抽象操作
查看>>
使用腾讯tslint-config-alloy轻松搞定ionic项目中TSLint配置
查看>>
Iceworks 支持小程序开发
查看>>
javascript手写轮播图播放效果
查看>>
React源码解析
查看>>