Python应用之利用pyecharts画中国地图

米米素材网

这段时间在爬取了杭州某网站发布的二手房信息,在作图的时候发现在地图呈现上还是有欠缺,这里就把用到的贴出来,提升一下记忆。

之前有接触用Basemap绘制地图,但是在涉及到中国行政划分上感觉不是很方便。Echarts在数据可视化上应用比较广泛,这里采用pyecharts生成echarts风格的图表。

环境:pycharm;python3.6;

1、安装

pycharts包的安装

pip install pyecharts

在绘制地图时,需要导入相应的地图文件包

  • 全球国家地图: echarts-countries-pypkg (1.9MB)
  • 中国省级地图: echarts-china-provinces-pypkg (730KB)
  • 中国市级地图: echarts-china-cities-pypkg (3.8MB)

建议绘图之前就装好,安装方法跟安装工具包的方法一致:

pip install echarts-countries-pypkg;
pip install echarts-china-provinces-pypkg
pip install echarts-china-cities-pypkg

2、绘制地图

from pyecharts import Map

# attr, value要显示的数值
value = [20, 100]
attr = ['余杭区', '萧山区']

# 图框的基本特性
m = Map('杭州地图示例图', width=600, height=400)

# 添加数据到图框中
m.add('', attr, value, maptype=u'杭州', visual_range=[0, 100], is_visualmap=True, visual_text_color='#000')

# show_config() 打印输出图表的所有配置项
m.show_config()

# render() 生成 .html 文件
m.render()

m = Map( title=”“, subtitle=”“, **kwargs) 指定图框基本特性。

m.add(**kwargs)主要用于数据呈现,依次为图例、x, y。

  • attr: list, 是地级市名的列表,你要对哪个区域进行标注,就写入对应的区域。注意里面的名字要规整,不然后面就标记不成功。
  • value:list, 是attr各区对应的数值。
  • maptype=u’杭州’:指定需要绘制的地区的区域。可以是省级地名,也可以是市级地名。
  • visual_range=[0,100]:指定地图的颜色范围区间,默认是[0,100]。这里主要是参考y值的范围,便于生成有颜色差的图形。
  • is_label_show=True :显示每个点的值x

m.show_config(): 会在终端打印出图表文件的所有配置项。

m.render():默认在当前文件生成一个render.html 文件

通过浏览器打开生成的render.html文件即可看到生成的图形


pyecharts的坑---“画图不显示“

关于Pyecharts画图,图却不显示出来的问题,出问题可能有好几种原因。可能是版本问题、包没下全等等,在这边说的是一个很坑的问题,博主因为这个白白浪费了好几个小时和精力。

最近在做数据挖掘课设,用pandas处理数据,十分的方便,没错,图不显示就是因为它。

下面为大家举个例子

假设我们有一组数据,转为DataFrame或者Series后经过多种处理,最终从中提取出来,想要用pyecharts做一个图,于是就会出现文章标题这样的错误。

from pyecharts.charts import Bar
from pyecharts import options as opts
import pandas as pd

x = [16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
y = [3, 8, 7, 18, 28, 48, 59, 44, 61, 80, 69, 59, 63, 59, 64, 46, 64, 55, 50, 62, 57, 51, 44, 34, 34, 34, 40, 34, 39, 41, 22, 43, 30, 23]
pdx = pd.Series(x)
pdy = pd.Series(y)
x_value = pdx.values
y_value = pdy.values
# Pyecharts 1.9.0所以支持链式表达
bar = (
    Bar()
    .add_xaxis(x_value)
    .add_yaxis("y值", y_value)
    .set_global_opts(title_opts=opts.TitleOpts(title="标题"))
)
bar.render()

让我们来看看这样画出来的图,就会发现它显示不出来。

原因如下

print(x_value)
print(type(y_value))
print(type(y_value[0]))

打印出来之后就会发现:

[16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
 40 41 42 43 44 45 46 47 48 49]
<class 'numpy.ndarray'>
<class 'numpy.int64'>

列表中的数据类型为numpy.int64

而pyecharts要求int类型的数据,所以画的柱状图无法显示数据。

正确的做法就是把数据全部转为int类型,或者不用pandas处理数据…

我尝试着在转为datafram、或series时将类型转为int,但它还是会自动转为numpy.int32。

pdx = pd.Series(x, dtype=int)
pdy = pd.Series(y, dtype=int)

print类型

<class 'numpy.ndarray'>
<class 'numpy.int32'>

不过知道原因之后就好解决了。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持米米素材网。