★网站内容的指标
要挖掘互联网的资源,首先需要关注网站的内容。俺大致总结了几个指标,任何网站的内容,都具有这几个指标。
通过这些指标,可以评估某个网站【对你的价值】到底有多大,还可以评估你挖掘其中的内容需要耗费多少时间和精力。
◇内容的信噪比
任何一个网站的内容,都会有一些信息是无用的,咱们称之为“噪声”。所谓的【信噪比】,就是是“有用信息”与“垃圾噪声”的比率。显然,信噪比越大越好。
提醒一下:信噪比的评价是【主观】滴。因为每个人的关注点(价值取向)不同,所以同样的内容,对不同的人,会有不同的信噪比。
◇内容的可搜索性
主要指网站的内容是否容易被搜索引擎检索和收录。
这个指标是客观的。
◇内容的生命周期
主要指网站内容的生命周期的长短。关于信息的生命周期,稍微解释一下:对于某个信息而言,只有在它的生命周期之内,该信息才有价值;过了生命周期,就没有价值。
举例:
比如美国大选之前,某人制作了一个分析报告,分析竞选双方的得票率。那么,当大选结果揭晓之后,这个报告的生命周期就结束了。
这个指标是半主观半客观的。
俺通常关注那些生命周期较长的内容。因为在网上冲浪是需要消耗时间和精力的。如果你关注的都是生命周期很短的信息,从“投资回报率”的角度来看,是不合算滴!
◇内容的组织性
指的是网站的不同内容之间,是否具有较好的分类,是否具有较好的层次,是否具有较好的关联。
这个指标是客观的。
组织性越好,你就越容易找到该网站的其它感兴趣的内容。
★网站的类型
互联网上的网站,大致上可以分为“功能型”和“内容型”。如果你要在网上找自己感兴趣的资源,“内容型”网站才是你的最终目标。
“内容型”的网站的网站,按照内容创建的方式,大体上可以分为“Web 1.0”和“Web 2.0”两大类。这两类的区别如下:
“Web 1.0”——网站内容由专职的网站编辑创建
“Web 2.0”——网站内容用户创建,洋文叫“UGC”
对于 Web 2.0 的网站,还可以再细分为如下几类:
论坛类(BBS、邮件列表)、博客类(包括轻博客)、微博客(Micro Blog)、社交类(SNS)、文件共享类、百科类、问答类、等等。
对于上述这些分类,俺来分别介绍一下。
★Web 1.0
Web 1.0 的典型代表,包括早期的门户网站、某些专业类网站、某些报考杂志的Web版、等等。
◇内容的可搜索性
这类网站通常是“搜索引擎友好”的,甚至还会针对搜索引擎做优化(SEO)。因为这类网站需要利用搜索引擎帮它带来用户流量。
◇内容的组织性
这类网站的内容是由专职编辑维护的,所以内容的组织性通常比较好。比如网站通常会有分类导航,相关的网页之间会有超链接。
◇内容的生命周期
如果是专业性的网站,内容的生命周期一般比较长;如果是新闻类的,则比较短。
◇内容的信噪比
对于新闻类的网站,信噪比通常不会太好。对于专业类的网站,则视具体情况而定。
◇俺的使用场景
俺平常【不】主动去逛那些 Web 1.0 的网站。
通常是在搜索引擎中找某关键字,然后跳转到该网站的某篇文章。
如果俺觉得这篇文章的质量差,直接关掉。
如果俺觉得这篇文章的质量好,会顺便浏览该网站相关的文章(根据站内导航、文章的交叉链接)。
如果浏览了多篇文章之后,发现总体的质量较好,会把该网站加入自己的收藏或者是订阅该网站的 RSS(如果有的话)。
★论坛类(BBS)
论坛类的网站,早在 Web 2.0 概念提出之前,就已经很流行了。
◇内容的可搜索性
大部分论坛的内容,是无需登录即可浏览的。所以大部分论坛都是可搜索的;极少数是不开放的,则搜索引擎无法收录论坛内容。
◇内容的组织性
论坛里面的帖子,通常会根据类型分在不同的板块。板块内的帖子,通常只提供排序功能(比如 按时间、浏览数、回帖数 等),有些论坛可以按照发帖人来组织帖子。
总的来说,论坛类内容的组织性,算中上。
◇内容的生命周期
这取决于论坛的定位。不同的论坛,差异较大。
比如:一个讨论娱乐圈八卦的论坛,帖子的生命周期就比较短;而一个讨论哲学的论坛,帖子的生命周期相对较长。
◇内容的信噪比
大部分论坛的信噪比都不好——灌水的比例居高不下。
有些论坛的版主会专门整理一个精华区,那么信噪比会有所改善。
◇俺的使用场景
传统的 BBS,俺【从没】注册过帐号;邮件列表倒是注册过几个。
平时俺【不】主动去逛论坛类网站。
通常是在搜索引擎中找某关键字,然后跳转到某论坛的某帖子。
如果俺觉得这篇文章的质量差,直接关掉。
如果俺觉得这篇文章的质量好而且是原创,会顺便浏览该发帖人的相关文章(这种情况不多见)。
★博客类(Blog)
◇内容的可搜索性
这类网站通常是“搜索引擎友好”的,因为这类网站需要利用搜索引擎帮它带来用户流量。
◇内容的组织性
大部分博客都支持分类导航或者是标签(Tag)导航,某些博客之间还会搞交换链接。
组织性算是好的。
◇内容的生命周期
这个视具体的博客而定。
◇内容的信噪比
总的来说,博客的信噪比好于论坛、SNS、微博客。
◇俺的使用场景
博客类网站是俺的主要信息来源之一。关于博客类网站的信息获取,俺会在本系列后面专门介绍。
★微博客类(MicroBlog)
微博客是最近几年突然火爆起来的。国外首屈一指的当属“Twitter”,国内知名的山寨有“新浪微博”。
◇内容的可搜索性
通常情况下,微博客是可搜索的。但是,某些做成长微博的图片,其内容是不可搜索的。
◇内容的组织性
内容的组织较差,通常是根据时间轴组织内容。
信息的碎片化非常非常严重。
◇内容的生命周期
微博客的内容,通常生命周期都很短。你设想一下,你会去看某人在一个月之前发的微博客内容吗?甚至2-3天之前的内容,就已经没人关注了。
◇内容的信噪比
在这几种类型的网站中,微博客的信噪比估计是最差的。里面充斥着大量的噪声,还有大量同质化的信息。
◇俺的使用场景
俺在开博客前就注册过 Twitter 的帐号,平时几乎【不用】;【从没】注册过国内的微博客。
至于俺为啥不用微博客类,请参见《为啥俺不常用微博——兼谈时间管理心得》。
★社交类(SNS)
SNS 已经火了好几年了。国外首屈一指的当属“Facebook”,国内知名的山寨有“开心网”和“人人网”。
◇内容的可搜索性
有的 SNS 对搜索引擎友好(比如 G+),有些则不友好(比如 Facebook)。
◇内容的组织性
通常是按照用户来组织组织;对于具体的用户,再按照时间轴组织内容。
信息有不同程度的碎片化(视具体网站的具体用户而定)。总的来说,内容的组织性“中下”。
◇内容的生命周期
总的来说,内容的生命周期比博客短,比微博长。
◇内容的信噪比
总的来说,SNS的信噪比不如博客,好于微博客。
◇俺的使用场景
俺在开博客前就注册过 Facebook,前两年 G+ 推出后也注册了。但平时很少用。
通常是在搜索引擎中找某关键字,然后跳转到 SNS 网站的某页面。
如果觉得该页面的内容没价值,直接关掉。
如果觉得该页面的内容有价值,再去看看该 SNS 用户的其它内容。
如果该 SNS 用户的很多内容都不错,看看此人是否有博客,有的话就订阅。
★百科类
百科类网站,全球首屈一指的当然是“维基百科”,国内有山寨的“百度百科”和“互动百科”。
◇内容的可搜索性
这类网站通常是“搜索引擎友好”滴,甚至还会针对搜索引擎做优化(SEO)。因为这类网站需要利用搜索引擎帮它带来用户流量。
◇内容的组织性
通常会有良好的分类组织,词条之间会有很多交叉连接。
总的来说,内容组织性较好。
◇内容的生命周期
百科类网站的内容,通常生命周期很长。
◇内容的信噪比
百科类网站的词条,通常是以多人协作的方式维护的,一般不会有垃圾信息。
总的来说,信噪比很好。
◇俺的使用场景
俺通常只用维基百科。因为维基百科的词条最多,支持多种语言(可惜俺只看懂中文和英文),而且【不】存在“和谐”的问题。国内的百科类网站,政治敏感内容是查不到滴。
当俺接触到一个不熟悉的词汇,通常会先用搜索引擎搜该词条的维基百科。
看完维基百科对该词条的解释之后,如果意犹未尽,就再看看跟该词条相关的其它词条。
维基百科包含大多数主流的语言。所以有时候看完中文的词条,再去看看对应的英文词条。
★文件共享类
文件共享类的网站,有时候又称为“网盘”。不同的文件共享网站,内容和功能差异较大。
◇内容的可搜索性
在文件共享类网站中,有的是提供 Web 界面的——这类网站通常是搜索引擎友好的;还有一些是通过专门的 P2P 软件进行文件分享和下载的,搜索引擎未必能收录其内容。
即使是 Web 界面的文件共享,搜索引擎通常只能收录文件名,无法抓取文件内容。
◇内容的组织性
有些网站会根据文件上传者进行分类组织(比如新浪爱问),有些会根据文件内容所属领域进行分类(比如百度文库)。还有些网站会提供相关性推荐——列出下载该文件的网友同时也下载其它哪些文件。
总的来说,组织性中等。
◇内容的生命周期
被分享的文件,生命周期通常不会短。
◇内容的信噪比
信噪比因上传者而异,有的好有的差。
◇俺的使用场景
电子书是俺获取信息的主要途径之一,所以俺经常会去网上找电子书。
通常是在搜索引擎中找某电子书(搜索书名),然后跳转到某文件共享网站,下载之。
如果文件共享类网站提供相关性推荐,偶尔也会根据“相关性”的推荐,下载另外的电子书。
顺便插播一个通告:
俺在自己的网盘上分享了不少电子书,感兴趣的同学请用鼠标猛击"电子书清单"(需翻墙),就可以看到下载链接
★问答类
问答类是最近几年兴起的,国外的代表是“Quora”和“Stack Overflow”,国内的山寨是“知乎”。
◇内容的可搜索性
这类网站通常是"搜索引擎友好"的,甚至还会针对搜索引擎做优化(SEO)。因为这类网站需要利用搜索引擎帮它带来用户流量。
◇内容的组织性
通常会根据问题领域做分类,某些较好的问答类网站支持标签(Tag)功能。
总的来说,内容组织性较好。
◇内容的生命周期
这类内容的生命周期,通常较长。
◇内容的信噪比
信噪比中上,至少比论坛好。
◇俺的使用场景
俺【从没】注册过问答类网站的帐号,平时也【不】主动去逛问答类网站。
通常是碰到某技术问题,在搜索引擎中找相关的关键字,然后跳转到某问答类网站的某话题。
如果觉得这篇文章没帮助,直接关掉。
如果觉得这篇文章有帮助,看完,关掉。
★结尾
通过上述对比,你应该大致看出来,哪些类型的网站比较可能找到高价值的内容。
本系列的下一篇,俺介绍一下搜索引擎的基本技巧。
回到本系列的目录
本博客所有的原创文章,作者皆保留版权。转载必须包含本声明,保持本文完整,并以超链接形式注明作者编程随想和本文原始地址:
https://program-think.blogspot.com/2013/03/internet-resource-discovery-1.html
有人打算整理一下关于编程随想下落的线索吗?(从正反两个方面来举证)
好多怪事都是人为的,第一在搞邪术如祭鬼封神献祭打call,其次是搞种姓的事,
这帮东西用老外的名义来操控挑拨玩弄这个那个,这也是奇葩的,和叫东土人找阿三还是鬼子去表达册封封禅这皇帝是东土的皇帝一样奇葩, ......
ym蜀人都不愿放手的东西如屁眼套路,幼女,献祭,老单和最高神位是有原因的,很值得去研究的 ......
即使博主能活着出狱,若要看到他更新六四系列,那也是在天朝发生了民主化之后,共产党不再有能力镇压批评者之时。
就算哪天中国情报部门不经司法程序,直接把人暗杀了,我也不会觉得奇怪。
https://www.zaobao.com.sg/realtime/china/story20241226-5649612
https://www.youtube.com/watch?v=ozVq_04XMro
如果出现了自杀场景,多半是政府秘密下令处决,并伪装成了自杀。
来自Firsthack的评论
而且,二审的发改率(发回重审+改判)是一个考核政绩的指标,高层认为这个数字越低说明冤假错案越少,然后下面就越容易升官。 ......
原神UID:310221197410210025
互动热线: 13524626271 上海移动
学历: 硕士
生日: 19741021
身高: 165 ......
周欣身份证310105197106042383
户籍地址 :上海市闵行区吴中路429弄15号501室
同户人 :薛军,男,310106196903180414,1969年03月18日; ......
希望各大媒体都报道这几个名字:审判长周欣,审判员:凌莉、须梅华。
家属贝震颖推特号:Birds_b_r_32309
多谢分享“中药注射剂”等国产医疗行业的相关丑闻。
另外,关于疫情期间的乱象,俺整理了一篇:
《每周转载:白纸抗议年的“动态清零”灾难(网文14篇,多图)》
多年前不记得在哪篇博文的评论区和博主讨论叙利亚的命运,当时叙利亚的局势还未尘埃落定。可惜博主现在大牢内,看不到。
这次叙利亚的民主转型发生在俄国陷入战争的泥沼的背景下。 ......
这个是个邪术,第一个是给上面看(不知什么鬼),其次的就真的会指导目标去实际地去做这么些的犯罪邪恶,侵犯幼女的情节是经常频繁重复地出现地,和侵犯女性,还有就是生命 ......
估计到最高法院也没戏,可能会以9:0判决禁抖音。
欢迎提出不同观点。
你提到的是这二者之间的差异,俺也同意这些差异确实存在。
但是,俺要开始说但是了。从本文,咱们也可以讨论这二者之间的共性,至少包含以下方面: ......
玩邪术玩出个什么结果好歹给公开一下,拼命玩邪术还一声不吭,很危险的,要分享分享,劳资帮你们来研究研究
劳资相信这帮东西是能穿越时空的,现在是2019年的ZS,时空被改变穿越了。穿越时空的套路。这帮东西几千年都一个屌样,来几个十级地震都不会任何改变。 ......
现在的两党是争先比谁对华更强硬,已经通过的制裁法案不会松绑,已经加的关税也不会再降,否则就会被在野党骂成“通敌叛国”。
明年1月19日之前,抖音会被禁。
每天上网的好多人都在聊政治呢,难道你要把每一个聊政治的人都抓起来判刑?那也没用。因为年轻人越来越倾向于认为政治制度才是造成他们被困在他那个阶层的重要原因。 ......
这个博客对于政府的批评,大部分都是有理有据。你要是觉得哪里不对,可以反驳博主嘛。判7年是究竟有多心虚? ......
以色列做任何事,都是美国包容范围,和美国民意无关(甚至抗议都无效)。台湾今后也会差不多。
国会一旦提出新的关于台湾的法案,无论是军售,亦或是改善台湾的国际地位等等,都很容易造成近乎【全票通过】。 ......
然而,公报本身只是行政政府的声明,其效力不如法律。 ......
然而,现在的人们,对于不能证明是否为间谍的走线客,也不太宽容。估计人们会支持一律用“有间谍嫌疑”之类的理由,实行一律驱逐的政策。 ......
但是,有些两党已经形成共识的事,其实是不受太大影响的。例如:把台湾武装成以色列。
所以我估计,中共在川普第2任期的前2年之内,就会对台湾动手。
因为这次GOP在众院优势实在太小了,稍微发生一点差错,钟摆效应会让民主党夺回之。
参议院不好说。如果连参议院也丢了,那川普后两年就可能成为跛脚总统,啥事都干不了。
不服者会选择:明着顺从,其实背地里跟共产党对着干。
众议院估计是个险胜。
上次共和党在众议院也是微弱优势,导致议长难产。
这次应该不会难产,因为有川普在,他只要在台上喊几句,就可以让任何一个人当议长,其它共和党议员不会阻挠。 ......
根据NBC新闻:
https://www.nbcnews.com/politics/immigration/trump-may-deport-hundreds-thousands-migrants-biden-allowed-legally-ent-rcna179357 ......
就是先用民调测量其它选举,比如某个地方议员的选举,然后和民调进行对比,看女性候选人是否严重吃亏,是否和民调严重不符。
如果发生该现象,那得出的差额数字,就是该地隐藏的“害羞的性别歧视者”的百分比。 ......
因为“害羞的川粉”等受访者不诚实回答问题的现象,仍然使得民调失真。
贺锦丽连普选票都输了。
你民主党输得这么惨,总不能反思为啥没去迎合那些“黑命贵零元购”之类的种族主义口号吧?反思搞种族平权搞得过头了?
......
美国出了个川贼东。抗战前没做到【攘外必先安内】,这下麻烦大了。
恭喜美国又创造了世界纪录。
估计是川普险胜。
因为大法官的任命是由总统和参议院共同决定,如果总统是川普,那他就会提名非常有争议的保守派大法官。
......
......
川普险胜29%
其它情况基本可以排除。
我的意见是把第13问算成川普+1,他不是国家英雄,但很多人粉川。
然后把第12问算成贺锦丽+1,因为川黑人数太多了,这些人的票会投给贺锦丽。
◇以【川普】为中心展开
◇极化现象
这个没变
......