详情

第0x24章 书客各种数据与收藏的关系 3

  注:所有数据如未特殊注明,截止至2019年3月12日15时34分3XzJmM

  ✿✿✿✿✿3XzJmM

  更新哦~3XzJmM

  先解释一下……括号里的图片是占位啦!3XzJmM

  因为书客章节的图片只能发布章节之后才能插图,但是如果直接插图的话间贴又会乱掉。3XzJmM2

  所以就先用一个空行占位啦。3XzJmM

  只要段落数量不变的话,间贴就不会乱!3XzJmM

  唔……背锅部的技术……3XzJmM

  ✿✿✿✿✿3XzJmM

  话说之前契拉大佬提了下√x拟合以及决定系数R²,于是就去学了下……3XzJmM

  然后这就是新的图哦~3XzJmM

  【图1:书籍点击与收藏关系(收藏<4w,点击<2500w)】3XzJmM2

  点击收藏拟合2 3XzJmM

  看上去二次多项式还是比较准确的……其他的都很迷……3XzJmM3

  因为如果根号下也有系数的话……就会各种报错,所以把纵横轴对换了一下之后再做了一次分析。3XzJmM

  【图2:书籍收藏与点击关系,坐标轴对调~】3XzJmM

  收藏点击拟合 3XzJmM

  可以看出二次曲线和指数函数的拟合是比较好的。3XzJmM

  但是……这里的二次曲线的决定系数R²有0.999……3XzJmM1

  总觉得炒鸡不科学……3XzJmM

  因为之前字数与收藏的那一大堆散点的拟合结果,决定系数都有0.998!3XzJmM

  太不科学了。3XzJmM

  璃酱怕不是学了个假的公式……3XzJmM

  【图3:决定系数的公式……应该是对的吧……】3XzJmM

  决定系数 3XzJmM1

  再加上数据这么散,总不可能是过拟合吧……3XzJmM

  总之非常不科学。3XzJmM

  不过字数与收藏的拟合……不知道能不能看成是高于这条线的都是相对比较火的书,低于这条线的是相对比较扑的书……3XzJmM

  【图4:再贴一次吧……函数就去上一章看吧】3XzJmM

  字数收藏拟合 3XzJmM

  有可能呢~3XzJmM

  ✿✿✿✿✿3XzJmM

  嗯,接下来就随便做点补充吧~3XzJmM

  比如每段字数对应的平均收藏。3XzJmM

  上图~3XzJmM

  【图5:书籍字数与平均收藏】3XzJmM

  字数与平均收藏 3XzJmM

  可以看出在10w字以下,所有书籍的平均收藏都很低,但是10w~100w字的平均收藏就有2258.42了,100w~1000w字的书的平均收藏都有13703.05了。3XzJmM7

  字数越多收藏越多嘛~3XzJmM

  所以要想涨收,还是要多写点的呢~3XzJmM

  虽然也有很扑的书就是了。3XzJmM

  接下来就是书名长度与平均收藏的关系。3XzJmM

  本来想做折线图的,但是想了下20条折线完全没必要呀!3XzJmM

  太乱啦。3XzJmM

  于是就还是计算平均收藏吧~3XzJmM

  【图6:书名长度与平均收藏】3XzJmM

  书名长度与平均收藏 3XzJmM

  嗯,看起来平均收藏都不怎么高啊……3XzJmM

  毕竟扑街的书实在是太多了。3XzJmM

  不过还是能看出来点东西的,比如书名长度的高峰依然集中在9~12字。3XzJmM

  和之前的结论吻合呢。3XzJmM

  那么接下来就是……书籍分类与平均收藏!3XzJmM

  【图7:书籍分类与平均收藏】3XzJmM

  分类与平均收藏 3XzJmM

  平均收藏最高的就是动漫穿越了,虽然基数很大,但是数据也都很好呢。3XzJmM

  其次是青春日常,虽然书籍数量在书客排到第五,但是平均收藏排到了第二呢。3XzJmM

  也是真的大家都比较喜欢的题材,很多人看呢。3XzJmM

  第三是……战争历史?3XzJmM

  和第四……游戏世界?3XzJmM

  可能是因为这两个分类的书比较少,再加上有几本比较火的书吧……这个结果好不科学……3XzJmM

  那么接下来就用每个分类下的千收与万收比例来看一下吧~3XzJmM

  【图8:书籍分类与收藏比例】3XzJmM

  分类与收藏比例 3XzJmM

  唔,战争历史反而高了是怎么回事……千收比例居然占到了10%。3XzJmM2

  先说一下整个书客的数据吧,书客千收以上的比例是8.51%,万收以上的比例是1.70%。3XzJmM

  可以看出动漫穿越、战争历史、青春日常、游戏世界和热血竞技的千收比例要比全站比例高,其中动漫穿越甚至要高3%左右。3XzJmM

  万收的比例结果也差不多,但是热血竞技的万收比例却相当的低。3XzJmM1

  因为这整个区就只有319本书!3XzJmM

  所以想看热血竞技的读者也没什么看的,于是就只能去看这些书了。3XzJmM

  所以千收比例很高。3XzJmM

  但是万收……可能是这个区真的很冷吧。3XzJmM2

  在结合之前的结论,异界幻象和超现实都市虽然写的人会比较多,上架的也比较多,但是千收的比例就不是那么多了。3XzJmM

  因为写的人太多了,如果没有什么出彩的地方的话……那还是没什么人看。3XzJmM

  ✿✿✿✿✿3XzJmM

  嗯,今天好短啊!3XzJmM

  怠惰中……3XzJmM

  不过本来只有500字的,后来又写了好多。3XzJmM

  好像没想到什么零零碎碎的了。3XzJmM

  之后就应该是再看一下标签的分析,推荐票和月票、打赏以及征文的分析了。3XzJmM

  再之后就是关于章节的分析~3XzJmM

  不过中间可能会咕咕很长一段时间,因为章节的数据目前还没有,要去弄很长时间……3XzJmM

  取材啦!取材!3XzJmM

  这可是王道的咕咕理由呢!3XzJmM

  话说璃酱画图都是用matplotlib画的哦~3XzJmM

  python的近似于matlab的库,加上numpy和Scipy是可以媲美matlab的呢。3XzJmM

  比如最近做的拟合都是Scipy自带的curve_fit(),完全不用自己写函数啦。3XzJmM

  而且程序也不大。3XzJmM

  不过之前在敲代码画图的时候还发现了一个很神奇的问题,但是在这里就不说了……3XzJmM

  去CSDN上提问了看看,不过估计没人回答吧……3XzJmM

  以后找大佬问吧~3XzJmM

  那么,下章见~3XzJmM

  ✿✿✿✿✿3XzJmM

  感谢萧风暮雨大佬的辣条!3XzJmM

  感谢八云家の本子墨大佬的2张月票!3XzJmM2

  感谢道与理大佬的4个辣条!3XzJmM

  感谢懵逼大佬的2个辣条和2张月票!3XzJmM

  感谢史绪超可爱大佬的咸鱼突刺!3XzJmM

  感谢焕东大佬的2张月票!3XzJmM

  感谢病名为爱碧落酱大佬的3张月票!3XzJmM

  感谢将赐核则万古瞑大佬的咸鱼突刺!3XzJmM

  感谢ForЯua、仙道诸神科技、玥瑶、(๑︿๑)累、地狱因幡白兔、契拉、飯要一口一口吃、mlao0018、仙道诸神科技、终焉的因果律、燃刃白、某天帝、浊酒留风尘、以吾等信条之名、黑衣武神桐谷和人、姆q又见姆q、道与理、死给你看T^T、小金魚天道、异端审问会、PH丨秦心、满江烟雨、史绪超可爱、紧闭的恋之瞳、初雨浅落、金.苹.果、千枫硫、病名为爱碧落酱、德丽莎、刀狂剑痴叶小钗、叶染、七,天、炸弹仁,伪、光暗的螺旋大佬们的推荐票!3XzJmM

  感谢各位的评论及间贴!3XzJmM

  感谢!3XzJmM

本章结束