注:所有数据如未特殊注明,截止至2019年3月12日15时34分3XzJmM
因为书客章节的图片只能发布章节之后才能插图,但是如果直接插图的话间贴又会乱掉。3XzJmM2
话说之前契拉大佬提了下√x拟合以及决定系数R²,于是就去学了下……3XzJmM
【图1:书籍点击与收藏关系(收藏<4w,点击<2500w)】3XzJmM2
看上去二次多项式还是比较准确的……其他的都很迷……3XzJmM3
因为如果根号下也有系数的话……就会各种报错,所以把纵横轴对换了一下之后再做了一次分析。3XzJmM
但是……这里的二次曲线的决定系数R²有0.999……3XzJmM1
因为之前字数与收藏的那一大堆散点的拟合结果,决定系数都有0.998!3XzJmM
3XzJmM1
不过字数与收藏的拟合……不知道能不能看成是高于这条线的都是相对比较火的书,低于这条线的是相对比较扑的书……3XzJmM
可以看出在10w字以下,所有书籍的平均收藏都很低,但是10w~100w字的平均收藏就有2258.42了,100w~1000w字的书的平均收藏都有13703.05了。3XzJmM7
本来想做折线图的,但是想了下20条折线完全没必要呀!3XzJmM
不过还是能看出来点东西的,比如书名长度的高峰依然集中在9~12字。3XzJmM
平均收藏最高的就是动漫穿越了,虽然基数很大,但是数据也都很好呢。3XzJmM
其次是青春日常,虽然书籍数量在书客排到第五,但是平均收藏排到了第二呢。3XzJmM
可能是因为这两个分类的书比较少,再加上有几本比较火的书吧……这个结果好不科学……3XzJmM
那么接下来就用每个分类下的千收与万收比例来看一下吧~3XzJmM
唔,战争历史反而高了是怎么回事……千收比例居然占到了10%。3XzJmM2
先说一下整个书客的数据吧,书客千收以上的比例是8.51%,万收以上的比例是1.70%。3XzJmM
可以看出动漫穿越、战争历史、青春日常、游戏世界和热血竞技的千收比例要比全站比例高,其中动漫穿越甚至要高3%左右。3XzJmM
万收的比例结果也差不多,但是热血竞技的万收比例却相当的低。3XzJmM1
所以想看热血竞技的读者也没什么看的,于是就只能去看这些书了。3XzJmM
但是万收……可能是这个区真的很冷吧。3XzJmM2
在结合之前的结论,异界幻象和超现实都市虽然写的人会比较多,上架的也比较多,但是千收的比例就不是那么多了。3XzJmM
因为写的人太多了,如果没有什么出彩的地方的话……那还是没什么人看。3XzJmM
之后就应该是再看一下标签的分析,推荐票和月票、打赏以及征文的分析了。3XzJmM
不过中间可能会咕咕很长一段时间,因为章节的数据目前还没有,要去弄很长时间……3XzJmM
python的近似于matlab的库,加上numpy和Scipy是可以媲美matlab的呢。3XzJmM
比如最近做的拟合都是Scipy自带的curve_fit(),完全不用自己写函数啦。3XzJmM
不过之前在敲代码画图的时候还发现了一个很神奇的问题,但是在这里就不说了……3XzJmM
感谢八云家の本子墨大佬的2张月票!3XzJmM2
感谢ForЯua、仙道诸神科技、玥瑶、(๑︿๑)累、地狱因幡白兔、契拉、飯要一口一口吃、mlao0018、仙道诸神科技、终焉的因果律、燃刃白、某天帝、浊酒留风尘、以吾等信条之名、黑衣武神桐谷和人、姆q又见姆q、道与理、死给你看T^T、小金魚天道、异端审问会、PH丨秦心、满江烟雨、史绪超可爱、紧闭的恋之瞳、初雨浅落、金.苹.果、千枫硫、病名为爱碧落酱、德丽莎、刀狂剑痴叶小钗、叶染、七,天、炸弹仁,伪、光暗的螺旋大佬们的推荐票!3XzJmM