利用python从中文中提取关键词

我想从一组中文字符串中取得关键词,如“出版社”,然后将“朝华出版社”赋值给publisher。但是不知道应该怎么做,已经做了如下尝试。希望能够得到解答。

python>>>import sys
>>>reloadsys
>>>sys.setdefaultencodingutf8
>>>
>>>import re
>>>text = 出版社: 朝华出版社
出版年: 2007-12
页数: 752
定价: 49.80元
装帧: 平装
ISBN: 9787505417670 >>>re.findallr出版社:.*?.encodeutf-8, text.encodeutf-8
[]

print re.findallr出版社: [sS]*?
, text[0]

pythontranslations = { 出版社: publisher, #...
} text = 出版社: 朝华出版社
出版年: 2007-12
页数: 752
定价: 49.80元
装帧: 平装
ISBN: 9787505417670 data = {}
for l in text.strip.splitlines: k, v = l.split: , 1 data[translations.getk, k] = v
printdata

你问的是 Y 问题。以上是我猜测出来的 X 问题。参见:X-Y Problem | 酷 壳 – CoolShell.cn

发表评论

电子邮件地址不会被公开。 必填项已用*标注