引用 PKU-DP列表

1014 装箱问题

1015 Jury Compromise
1029 False coin
1036 Gangsters
1037 A decorative fence
1038 Bugs Integrated, Inc.
1042 Gone Fishing
1050 To the Max
1074 Parallel Expectations
1080 Human Gene Functions
1088 滑雪
1093 Formatting Text
1112 Team Them Up!
1141 Brackets Sequence
1143 Number Game
1157 LITTLE SHOP OF FLOWERS
1159 Palindrome
1160 Post Office
1163 The Triangle
1170 Shopping Offers
1178 Camelot
1179 Polygon
1180 Batch Scheduling
1185 炮兵阵地
1187 陨石的秘密
1189 钉子和小球
1191 棋盘分割
1192 最优连通子集
1208 The Blocks Problem
1239 Increasing Sequences
1240 Pre-Post-erous!
1276 Cash Machine
1293 Duty Free Shop
1322 Chocolate
1323 Game Prediction
1338 Ugly Numbers
1390 Blocks
1414 Life Line
1432 Decoding Morse Sequences
1456 Supermarket
1458 Common Subsequence
1475 Pushing Boxes
1485 Fast Food
1505 Copying Books
1513 Scheduling Lectures
1579 Function Run Fun
1609 Tiling Up Blocks
1631 Bridging signals
1633 Gladiators
1635 Subway tree systems
1636 Prison rearrangement
1644 To Bet or Not To Bet
1649 Market Place
1651 Multiplication Puzzle
1655 Balancing Act
1661 Help Jimmy
1664 放苹果
1671 Rhyme Schemes
1682 Clans on the Three Gorges
1690 (Your)((Term)((Project)))
1691 Painting A Board
1692 Crossed Matchings
1695 Magazine Delivery
1699 Best Sequence
1704 Georgia and Bob
1707 Sum of powers
1712 Flying Stars
1714 The Cave
1717 Dominoes
1718 River Crossing
1722 SUBTRACT
1726 Tango Tango Insurrection
1732 Phone numbers
1733 Parity game
1737 Connected Graph
1740 A New Stone Game
1742 Coins
1745 Divisibility
1770 Special Experiment
1771 Elevator Stopping Plan
1776 Task Sequences
1821 Fence
1837 Balance
1848 Tree
1850 Code
1853 Cat
1874 Trade on Verweggistan
1887 Testing the CATCHER
1889 Package Pricing
1920 Towers of Hanoi
1926 Pollution
1934 Trip
1936 All in All
1937 Balanced Food
1946 Cow Cycling
1947 Rebuilding Roads
1949 Chores
1952 BUY LOW, BUY LOWER
1953 World Cup Noise
1958 Strange Towers of Hanoi
1959 Darts
1962 Corporative Network
1964 City Game
1975 Median Weight Bead
1989 The Cow Lineup
2018 Best Cow Fences
2019 Cornfields
2029 Get Many Persimmon Trees
2033 Alphacode
2039 To and Fro
2047 Concert Hall Scheduling
2063 Investment
2081 Recaman's Sequence
2082 Terrible Sets
2084 Game of Connections
2127 Greatest Common Increasing Subsequence
2138 Travel Games
2151 Check the difficulty of problems
2152 Fire
2161 Chandelier
2176 Folding
2178 Heroes Of Might And Magic
2181 Jumping Cows
2184 Cow Exhibition
2192 Zipper
2193 Lenny's Lucky Lotto Lists
2228 Naptime
2231 Moo Volume
2250 Compromise
2279 Mr. Young's Picture Permutations
2287 Tian Ji -- The Horse Racing
2288 Islands and Bridges
2292 Optimal Keypad
2329 Nearest number - 2
2336 Ferry Loading II
2342 Anniversary party
2346 Lucky tickets
2353 Ministry
2355 Railway tickets
2356 Find a multiple
2374 Fence Obstacle Course
2378 Tree Cutting
2384 Harder Sokoban Problem
2385 Apple Catching
2386 Lake Counting
2392 Space Elevator
2397 Spiderman
2411 Mondriaan's Dream
2414 Phylogenetic Trees Inherited
2424 Flo's Restaurant
2430 Lazy Cows
2533 Longest Ordered Subsequence
2915 Zuma
3017 Cut the Sequence
3028 Shoot-out
3124 The Bookcase
3176 Cow Bowling
3133 Manhattan Wiring
3345 Bribing FIPA
3356 AGTC
3375 Network Connection
3420 Quad Tiling

数据集准备: Weibo NER 是面向中文社交媒体文本的数据集,由 Peng 等人于 2015 年提出,主要用于微博等短文本场景下的实体识别研究。该数据集以新浪微博用户生成内容为基础,标注了 人名(PER)、地名(LOC)、机构名(ORG)、时间(TIME)四类实体,采用 BMES 标注体系(如 “B-PER” 表示人名开始,“E-PER” 表示人名结束)。本实验做的是分词任务,因此,因此选用的是没有BMES标注体系的数据集:  1.1 数据集选择: 分词任务训练集:data/pku_training.utf8 包含 1350 条标注样本用于分词模型训练。 分词任务开发集(验证集):data/pku_test_gold.utf8 包含 270 条标注样本用于分词模型调参。 分词任务测试集:data/pku_test_gold.utf8 包含 270 条标注样本用于分词模型性能评估。  1.2 文件格式: 文本采用 UTF-8 编码,每行对应一条样本。 每个词之间通过空格分隔。 。  1.3 BIO标注格式: 对原始数据集使用 BMES 标注体系,其中: B:实体开始(Begin) M:实体中间(Middle) E:实体结束(End) S:单字词实体(Single) 1.4 数据集下载方式: github网站: https://github.com/hltcoe/golden-horse/tree/master。 2.数据加载与预处理: 2.1 加载分词任务训练集、分词任务开发集和分词任务测试集。 2.2 将原始文本转换为字符级序列,并生成对应的BMES标签序列。 例如: 输入:才 发觉 已 迷失 了 来路 。 输出字符序列: ['才', '发觉', '已', '迷失', '了', '来路', '。'] 标签序列: ['S', 'B', 'E', 'S', 'B', 'E', 'S', 'B', 'E', 'S'] 2.3 词典构建与统计: 训练集中的词频和最大词长,用于后续模型设计。 3. HMM模型参数统计: 3.1 模型参数定义 状态集合(States):{'B', 'M', 'E', 'S'} 初始概率(π):每个状态作为序列起点的概率 转移概率(A):状态间转移的概率矩阵 发射概率(B):状态生成观测字符的概率 3.2 求解上述参数 4.实现分词算法: 4.1使用Viterbi算法找到最大化观测序列概率的状态路径,递推公式如下: 4.2 对测试文本进行分词,并输出分词结果。 5.模型测试与评估: 5.1使用 测试集 对模型进行测试,并计算准确率(Precision)、召回率(Recall)和 F1值 。 5.2 使用前向算法计算观测序列的生成概率 Ρ(Ο|λ)。 5.3 使用后向算法计算观测序列的生成概率 Ρ(Ο|λ)。 5.4 统计测试集中前后向概率一致的句子比例 返回: - total_sentences: 总句子数 - consistent_count: 前后向概率一致的句子数 - inconsistent_count: 前后向概率不一致的句子数。
最新发布
03-28
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值