网页2010年百度之星程序设计方案大赛初赛

百度智能小程序  时间:2021-02-24  阅读:()

2008年百度之星程序设计大赛初赛第二场题目

1.广告排名区间( 10分)

问题背景shifen广告消费预估系统可以估计出一段时间内一个特定的广告在检索结果中排在各个位置的几率。 比如系统对某广告的输出如下p1=0.03,p2=0.08,p3=0.04. . . . . . . . . . . . .

这说明该广告展现在第1位的概率是3%展现在第2位的概率是8%展现在第3位的概率是4%••…

问题是如何给出一个排名估计区间 i,j 使得广告出现在该区间中的概率大于或等于一个预设值p,同时这个区间所包含的元素尽可能的少。也可用数学语言来描述给定数p和数列p1,p2,…,pn求i和j(1<=i<=j<=n)在满足pi+pi+1+…+pj>=p的前提下让j-i最小。

一般来说 pi只需保留6位小数就足够了。这样若令ai=106pi ,a=106p,则a和所有的ai均为0,106之间的整数。这样就避免了对实数的处理。

输入格式

第一行包含一个整数n(1<=n<=100,000) 。

以下n行每行包含一个0,106 内的整数依次为al,a2,… an。这n个整数之和保证不超过106。

最后一行包含一个0,106 内的整数a。保证所有ai之和不小于a。

输出格式

输出仅一行包含一个整数 即j -i的最小值。

样例输入

7

5

8

4

7

10

5

2

18

样例输出

2

样例解释a2=8,a3=4,a4=7之和为19满足条件。而任何两个相邻数之和均小于 18。

2.LZW网页判重(20分)

问题背景

有一种简单的网页判重的方法通过求两个网页内容的最长公共子序列 (LCS)长度来判定两个网页的相似程度。如

网页A老师请用“果然”造句。

网页B学生先吃水果然后喝汽水. . . .

它们的最长公共子序列为“果然” 长度为2。注意这里的“子序列”并不要求连续。类似的下面两个网页

网页A老师请用“果然”造句。

网页B学生先吃水果然后喝汽水果然拉肚子……最长公共子序列还是“果然”长度为2。但不难看出 由于“果然”两个字在网页B中也曾连续出现第二组网页比第一组更加“相似”。为了区分开这两种情况的区分度我们改用一种称为L ZW的理论。为了严格的叙述相似度的计算方法我们首先定义“文本单元”。 假定网页用一个不包含空白字符空格、回车换行、水平制表符的字符串来表示。它只包含纯文本没有标签。在计算相似度之前你应该首先对该字符串进行处理划分成一个个“文本单元”。每个文本单位可以是一个中文字、 英文单词由一个或多个连续的半角英文字母和数字组成 正规表达式为[a-zA-Z0-9]+ 、或者一个标点符号。根据上述定义 同一个标点符号的全角和半角应该被作为不同的文本单元尽管他们看起来可能很相近每个单独全角英文和全角数字都应该被看成一个单独的文本单元而连续的半角英文字母和数字应被看成一个整体。总之全角的字符可以与中文字同等对待。这样 网页被看成文本单元序列。例如 网页“内容 12 3456??web2.00#”切分出的文本单元序列为为了显示方便用下划线分隔各文本单元  内_容_ _1

_2_345_6_?_?_web2_._00_#

而网页“why内容相似  1234567890,we b#00'的切分结果为why_内_容_相_似_?_?_1234567890_,_we b_#_00黑体部分给出了两个网页的一个公共子序列。注意“内容”、 “ ??”分别在两个网页中都是连续出现的文本单元。为了奖励这种情况 L ZW规定一段由连续k个文本单元组成的字符串权值为k2。在刚才的例子中 “内容”、 “  ?”的权值均为4。但“00”是一个数字串应当被看成一个单独的文本单元。所以权值仅为1 。

根据上述规则公共子序列“内容??00”的权值为22+22+1=9。在所有可能的子序列中这个权值是最大的。

给定两个网页求他们的L ZW相似度 即所有可能的公共子序列中的最大权值。

1 输入的网页内容以GBK编码参见FAQ

2 除了大小写英文字母和数字之外的其他半角字符均视为标点符号。输入格式包含两行分别是网页A和B对应的字符串不包含空白字符 。每行至少包含5个字节最多包含200个字节。

输出格式

输出仅一行包含一个整数为两个网页的 LZW相似度。

样例输入

内容 123456??web2.00#why内容相似??1234567890,we b#00

样例输出

9

样例解释

尽管两个网页里看上去都有“ 123456”但一方面第一个网页中混杂的全角和半角字符而另一方面 即使全部改成半角字符 由于数字串“ 123456”和

“1234567890”将分别看成一个单独的文本单元 因此无法部分匹配。

3.钉子与木板 30分

问题背景

墙上有n个钉子编号为1,2,…,n。其中钉子i的横坐标为i纵坐标初始为xi 。可以进行两种操作

O kv:竖直移动钉子k,坐标变为K v 。

1 stv若在高度为v处放一块横坐标范围是[s,t]的水平木板它将下落到什么高度换句话说求出钉子s,s+1,s+2,…,t的纵坐标中不超过v的最大值。 如果这些钉子的高度全部大于v,则木板将落到地上高度为0。注意在T操作时水平木板只是用来测试的“临时木板”将在测试后立即被拿走不会影响到后续测试工作。

输入格式

第一行包含两个整数n,m 即钉子的个数和操作的个数1<=n,m<=105。 以下n行一个不超过109的非负整数 即xi 。

输出格式

按照输入的顺序对于每个T操作输出一个整数 即该测试水平木板的最后高度。样例输入

54

1

3

5

7

9

1246

0310

1357

1355

样例输出

5

7

0

4.圆面覆盖40分

问题背景

在平面上有一个长为L,宽为W的长方形左下角坐标为0,0 右上角坐标为L,W 。给定一些圆第i个圆的圆心坐标为xi,yi 半径为Ri。

你的任务是求最小的正实数k使得把每个圆的半径变为原来的k倍后即第i个圆半径变为kRi 圆心位置不变 长方形将被这些圆完全覆盖。 换句话说,长方形内部或边界上的任意点均至少在一个圆的内部或边界上。

输入格式

输入第一行包含三个整数n,L,W 1<=*=50, 1<=L,Wv=1000 即圆的个数、长方形的长和宽。

以下n行每行三个不超过1000的正整数xi,yi和Ri。

输出格式

仅一行包含一个实数k保留小数点后三位。

样例输入

122

111

样例输出

1.414

趣米云月付460元,香港CN2云服务器VPS月付低至18元

趣米云早期为做技术起家,为3家IDC提供技术服务2年多,目前商家在售的服务有香港vps、香港独立服务器、香港站群服务器等,线路方面都是目前最优质的CN2,直连大陆,延时非常低,适合做站,目前商家正在做七月优惠活动,VPS低至18元,价格算是比较便宜的了。趣米云vps优惠套餐:KVM虚拟架构,香港沙田机房,线路采用三网(电信,联通,移动)回程电信cn2、cn2 gia优质网络,延迟低,速度快。自行封...

妮妮云(43元/月 ) 香港 8核8G 43元/月 美国 8核8G

妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款,超过2天不退款 物...

RFCHOST - 洛杉矶CN2 GIA VPS季付23.9美元起 100Mbps带宽

RFCHOST,这个服务商我们可能有一些朋友知道的。不要看官网是英文就以为是老外服务商,实际上这个服务商公司在上海。我们实际上看到的很多商家,有的是繁体,有的是英文,实际上很多都是我们国人朋友做的,有的甚至还做好几个品牌域名,实际上都是一个公司。对于RFCHOST商家还是第一次分享他们家的信息,公司成立大约2015年左右。目前RFCHOST洛杉矶机房VPS正进行优惠促销,采用CN2优化线路,电信双...

百度智能小程序为你推荐
微信对骂群工作微信群里骂人是什么行为?discuznt如何把discuz!nt的LOGO,改了免费开通黄钻能免费开通黄钻吗??pwPW考试是指什么数码资源网安卓有没有可以离线刷题的软件?安卓应用平台安卓系统支持的软件并不是那么多,为什么这么多人推崇?如何建立自己的网站怎么创建自己的网站迅雷云点播账号求个迅雷VIP 是VIP就可以 只用来看云点播 改密码是孙子。 谢了 ! 362135668@qq.com云挂机趣头条后台云挂机辅助后台云挂机辅助有谁用过?想了解实际情况。小米手柄买了个小米蓝牙手柄,游戏是可以玩但是按键位置不舒服,怎么可以改按键
广西虚拟主机 山东vps 阿里云浏览器 圣诞促销 合租空间 hostloc 速度云 免费测手机号 昆明蜗牛家 cloudlink 万网空间管理 河南移动梦网 杭州电信宽带优惠 酸酸乳 可外链的相册 成都主机托管 国外免费云空间 .htaccess windows2008 cdn加速技术 更多