脚本宝典收集整理的这篇文章主要介绍了SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫,脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
项目gIT:https://github.com/lqkweb/sql...
SQLflow (python3+)
Sqlflow based on python development, support to Spark, Flink, etc as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.
2019-01-22 更新界面,近期会规范一下代码,写一些注释并加入读写功能
主页:
结果页面:
项目目标
基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫。
安装python3环境, 执行项目
git clone https://github.com/lqkweb/sql...
pip install -r requirements.txt
(sqlflow/sqlflow/execute/main.py 中的data.csv需要修改成你电脑中的绝对路径,数据文件在sqlflow/data/中)
python manage.py
打开http://127.0.0.1:5000 就可以测试了。
项目测试
在http://127.0.0.1:5000/demo输入框输入:
测试1:
select * From A limit 3;
测试2:
select * from A limit 3 as B;
新开一个http://127.0.0.1:5000/demo网页, 直接就可以查询数据表B了:
select * from B limit 2;
as B 相当于创建了一个B临时表。
是不是很简单。
正在新增sql版机器学习算法功能, 谢谢支持。
正在新增sql版爬虫功能, 谢谢支持。
记得给个start鼓励一下!Thanks♪(・ω・)ノ
以上是脚本宝典为你收集整理的SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫全部内容,希望文章能够帮你解决SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫所遇到的问题。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。