SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫

发布时间:2019-06-09 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
项目gIThttps://github.com/lqkweb/sql...

SQLflow (python3+)

Sqlflow based on python development, support to Spark, Flink, etc as the underlying distributed computing engine, through a set of unified configuration file to complete the batch, flow calculation, the Rest service development.

2019-01-22 更新界面,近期会规范一下代码,写一些注释并加入读写功能

主页:

SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫

结果页面:

SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫

项目目标

基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫。

安装python3环境, 执行项目

git clone https://github.com/lqkweb/sql...

pip install -r requirements.txt

(sqlflow/sqlflow/execute/main.py 中的data.csv需要修改成你脑中的绝对路径,数据文件在sqlflow/data/中)

python manage.py

打开http://127.0.0.1:5000 就可以测试了。

项目测试

http://127.0.0.1:5000/demo输入框输入:
测试1:

select * From A limit 3;

测试2:

select * from A limit 3 as B;

新开一个http://127.0.0.1:5000/demo网页, 直接就可以查询数据表B了:

select * from B limit 2;

as B 相当于创建了一个B临时表。
是不是很简单

正在新增sql版机器学习算法功能, 谢谢支持。
正在新增sql版爬虫功能, 谢谢支持。
记得给个start鼓励一下!Thanks♪(・ω・)ノ

脚本宝典总结

以上是脚本宝典为你收集整理的SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫全部内容,希望文章能够帮你解决SQLflow:基于python开发的分布式机器学习平台, 支持通过写sql的方式,运行spark, 机器学习算法, 爬虫所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。