一、什么是标签(Tags)?

tags是一种标签,是一种新的信息组织形式,和分类类似,但是远比分类灵活,是对文章中关键信息的标记,是随着blog的兴起而流行起来的tag被广泛的应用在web2.0类的网站里。

简单的说,tags可以看出文章的关键词。

二、Javascript中的document.all.tags()如何使用,求一个简单的小例子。

document.all.tags("input")取到当前所有的input标签.

document.all.tags("input").item(0)就是第一个input标签

document.all.tags("input").item(0).checked第一个标签被选中

三、ASP 标签(tags)功能是如何实现的?

给你个提示吧

使用 sql 的 UNION 语法 可以合并相同内容

取得所有不同的标签可以使用以下语句:

sql="SELECT Tags.tags11 FROM Tags union SELECT Tags.tags2 FROM Tags union SELECT Tags.tags3 FROM Tags "

//写的有结构点

SELECT Tags.tags11

FROM Tags

union

SELECT Tags.tags2

FROM Tags

union

SELECT Tags.tags3

FROM Tags

//分别从三个字段中取出所有记录,然后使用UNION 句 合并相同的项目,结果就是都不重复的内容了

//显示所有标签

循环 输出 <%=rs(0)%>

//显示同一标签不同的用户

如果想 通过一个 tags 找出有关的userid 就 分别查询一下

sql="select user_id from tags where tags1='"&tags1&"' or tags2='"&tags2&"' or tags3=='"&tags3&"' "

四、什么是标签(Tags)?

Tag(中文叫做“标签”)

是一种更为灵活、有趣的日志分类方式,您可以为每篇日志添加一个或多个Tag(标签)

当然,您也可以简单地把一个Tag(标签)理解为一个日志分类,但是Tag和分类的不同之处也很明显:

首先,分类是您在写日志之前就定好的,而Tag是在您写完日志之后再添加的;

其次,您可以同时为一篇日志贴上好几个Tag(标签),方便自己随时查找,而原先一篇日志只能有一个分类;

再次,当您积累了一定数量的Tag之后,您可以看看自己在Blog中最经常写的是哪些话题;

最后,您可以看到有哪些人和自己使用了一样的Tag(标签),进而找到和您志趣相投的Blogger。

为什么要用Tags?

Tags是体现Blog社会性的最好方式。

Tags便于搜索引擎和基于Tags的分类软件更好的搜索和分类信息。

Tags是Category的最好补充和扩展。

Tags是一个开放的简易的有效的分类方法,有着广泛的应用前景。

五、Python中extract_tags()怎么对多行文本提取特征词而不是一行一行计算

[python] view plain copy

#coding:utf-8

import sys

reload(sys)

sys.setdefaultencoding("utf-8")

from multiprocessing import Pool,Queue,Process

import multiprocessing as mp

import time,random

import os

import codecs

import jieba.analyse

jieba.analyse.set_stop_words("yy_stop_words.txt")

def extract_keyword(input_string):

#print("Do task by process {proc}".format(proc=os.getpid()))

tags = jieba.analyse.extract_tags(input_string, topK=100)

#print("key words:{kw}".format(kw=" ".join(tags)))

return tags

#def parallel_extract_keyword(input_string,out_file):

def parallel_extract_keyword(input_string):

#print("Do task by process {proc}".format(proc=os.getpid()))

tags = jieba.analyse.extract_tags(input_string, topK=100)

#time.sleep(random.random())

#print("key words:{kw}".format(kw=" ".join(tags)))

#o_f = open(out_file,'w')

#o_f.write(" ".join(tags)+"\n")

return tags

if __name__ == "__main__":

data_file = sys.argv[1]

with codecs.open(data_file) as f:

lines = f.readlines()

f.close()

out_put = data_file.split('.')[0] +"_tags.txt"

t0 = time.time()

for line in lines:

parallel_extract_keyword(line)

#parallel_extract_keyword(line,out_put)

#extract_keyword(line)

print("串行处理花费时间{t}".format(t=time.time()-t0))

pool = Pool(processes=int(mp.cpu_count()*0.7))

t1 = time.time()

#for line in lines:

#pool.apply_async(parallel_extract_keyword,(line,out_put))

#保存处理的结果,可以方便输出到文件

res = pool.map(parallel_extract_keyword,lines)

#print("Print keywords:")

#for tag in res:

#print(" ".join(tag))

pool.close()

pool.join()

print("并行处理花费时间{t}s".format(t=time.time()-t1))

运行:

python data_process_by_multiprocess.py message.txt

message.txt是每行是一个文档,共581行,7M的数据

运行时间:

不使用sleep来挂起进程,也就是把time.sleep(random.random())注释掉,运行可以大大节省时间。