搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假设目前有一千万个查询记录(重复度比较高,其实互异的查询串不超过三百万个;显然,一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。现要统计最热门的10个查询串,且要求使用的内存不能超过1GB。以下各方法中,可行且效率最高的方法是(41)A.将一千万个查询串存入数组并进行快速排序,再统计其中每个查询串重复的次数 B.将一千万个查询串存入数组并进行堆排序,再统计其中每个查询串重复的次数 C.利用哈希表

题目
搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假设目前有一千万个查询记录(重复度比较高,其实互异的查询串不超过三百万个;显然,一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。现要统计最热门的10个查询串,且要求使用的内存不能超过1GB。以下各方法中,可行且效率最高的方法是(41)

A.将一千万个查询串存入数组并进行快速排序,再统计其中每个查询串重复的次数
B.将一千万个查询串存入数组并进行堆排序,再统计其中每个查询串重复的次数
C.利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用小根堆选出重复次数最多的10个查询串
D.利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用大根堆选出重复次数最多的10个查询串

相似考题
更多“搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假设目前有一千万个查询记录(重复度比较高,其实互异的查询串不超过三百万个;显然,一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。现要统计最热门的10个查询串,且要求使用的内存不能超过1GB。以下各方法中,可行且效率最高的方法是(41)”相关问题
  • 第1题:

    下列关于查询功能的叙述中,不正确的是( )。

    A.查询是在一个或多个数据表中,根据用户的需要,从表中提取数据

    B.查询将符合用户设定条件的数据保存到查询文件中

    C.在图书管理系统的数据表中,将所有日期已经过了应还日期而未还书的记录保存起来,这个结果就是一个查询

    D.使用查询得到所需要的数据,当下次需要这方面的数据时,仍然需要到数据表中去搜索


    正确答案:D

  • 第2题:

    在SQL Server 2000中,有教师表Teachers(TeacherID,Name,LeaderID),其中TeacherID是主码,类型是长度为4的普通编码定长字符串,且每位是0~9的数字字符;Name的类型是长度为10的普通编码可变长字符串;LeaderID是每个教师的领导的TeacherID。

    ①写出创建Teachers表的SQL语句,要求语句中包含所有的约束。

    ②现要查询TeacherID为“1234”的教师的领导的TeacherID,请给出相应的SQL语句,要求只使用一条SQL语句实现,且此语句中不允许包含子查询。


    正确答案:①create table Teachers( TeacherID char(4)check(TeacherID like" [0~9][0~9][0~9][0~9]") Name varchar(10) LeaderID char(4) primary key TeacherID foreign key LeaderlD references Teachers (TeacherID) ) ②select T2. LeaderID from Teachers as T1 join Teachers as T2 on T1.LeaderID=T2.TeacherID where T1.TeacherID=‘1234’
    ①create table Teachers( TeacherID char(4)check(TeacherID like" [0~9][0~9][0~9][0~9]"), Name varchar(10), LeaderID char(4), primary key TeacherID, foreign key LeaderlD references Teachers (TeacherID) ) ②select T2. LeaderID from Teachers as T1 join Teachers as T2 on T1.LeaderID=T2.TeacherID where T1.TeacherID=‘1234’

  • 第3题:

    SQL查询就是用户使用SQL语句来创建的一种查询。SQL查询主要包括联合查询、传递查询、__________和子查询等。


    正确答案:
    数据定义查询 【解析】本题考查SQL查询的知识。SQL查询可分为4种,联台查询将来自一个或多个表或查询的字段组合为查询结果的一个字段或列;传递查询可直接将命令发送到ODBC数据库服务器中;数据定义查询可以创建、删除或更改表和索引;子查询的结果可用寐进行进一步的查询。

  • 第4题:

    使用Request对象的QueryString集合可以检索HTTP查询字符串中变量的值。


    正确答案:正确

  • 第5题:

    关于原生SQL查询和命名查询,说法正确的是()。

    • A、执行原生SQL,需使用SQLQuery对象
    • B、SQLQuery是一个接口,继承了Query接口
    • C、Hibernate支持在映射文件中定义字符串形式的查询语句,这样的语句是命名查询语句
    • D、命名查询语句只能是HQL语句,不能是SQL语句

    正确答案:A,B,C

  • 第6题:

    下列关于字符串的描叙中错误的是()。

    • A、字符串是对象
    • B、String对象存储字符串的效率比StringBuffer高
    • C、可以使用StringBuffer sb="这里是字符串"声明并初始化StringBuffer对象sb
    • D、String类提供了许多用来操作字符串的方法:连接,提取,查询等

    正确答案:B,C

  • 第7题:

    当HTML表单用()方法向ASP文件传递数据时,用户提交的数据将附在URL的查询字符串中一起被提交到服务器端指定的文件中。


    正确答案:GET

  • 第8题:

    查询字符串是附加在网页URL后从()开始直到结尾的一串字符。

    • A、?
    • B、/
    • C、@
    • D、\

    正确答案:A

  • 第9题:

    多选题
    关于原生SQL查询和命名查询,说法正确的是()。
    A

    执行原生SQL,需使用SQLQuery对象

    B

    SQLQuery是一个接口,继承了Query接口

    C

    Hibernate支持在映射文件中定义字符串形式的查询语句,这样的语句是命名查询语句

    D

    命名查询语句只能是HQL语句,不能是SQL语句


    正确答案: B,D
    解析: 暂无解析

  • 第10题:

    单选题
    关于HTTP查询字符串,下列说法错误的是:()
    A

    使用Request对象的QueryString集合可以检索HTTP查询字符串中变量的值

    B

    当通过HTML表单提交数据时,若将表单的METHOD属性设置为POST,则表单数据将附加在查询字符串中被发送到服务器端

    C

    使用A标记创建超级链接时,可以将查询字符串放在URL后面,并使用“?”来分隔URL与查询字符串

    D

    若要通过查询字符串发送多个变量,应使用“&”符号分隔各个变量


    正确答案: A
    解析: 暂无解析

  • 第11题:

    单选题
    下列表示查询说法错误的是:()
    A

    参数查询是指在查询中要输入查询参数

    B

    在参数查询中可以不运用Parameters参数集合和Parameter参数对象

    C

    利用查询就是把放在ASP中的SQL语句事先写在数据库的查询中,加快查询操作的速度。

    D

    使用Command对象的Execute方法可执行在对象的CommandText属性中指定的查询。


    正确答案: C
    解析: 暂无解析

  • 第12题:

    单选题
    给出了如下的查询条件字符串String condition="insert book values(?,?,?,?,?)";下列哪个接口适合执行该SQL查询()。
    A

    Statement

    B

    PrepareStatement

    C

    CallableStatement


    正确答案: B
    解析: 暂无解析

  • 第13题:

    4 寻找热门查询:

    搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。假设目前有一千万个记录,这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。请你统计最热门的10个查询串,要求使用的内存不能超过1G。

    (1)请描述你解决这个问题的思路;

    (2)请给出主要的处理流程,算法,以及算法的复杂度。


    正确答案:
    4 题
    (1)思路:用哈希做
    (2) 首先逐次读入查询串,算哈希值,保存在内存数组中,同时统计频度(注意值与日志项对应关系) 选出前十的频度,取出对应的日志串,简单不过了。哈希的设计是关键。

  • 第14题:

    搜索引擎会通过日志文件把用户每次检索使用的所有查询串都记录下来,每个查询串的长度不超过255字节。假设目前有一千万个查询记录(重复度比较高,其实互异的查询串不超过三百万个;显然,一个查询串的重复度越高,说明查询它的用户越多,也就是越热门)。现要统计最热门的1 0个查询串,且要求使用的内存不能超过1GB。以下各方法中,可行且效率最高的方法是( )。

    A.将一千万个查询串存入数组并进行快速排序,再统计其中每个查询串重复的次数B.将一千万个查询串存入数组并进行堆排序,再统计其中每个查询串重复的次数C.利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用小根堆选出重复次数最多的1 0个查询串D.利用哈希表保存所有的查询串并记下每个查询串的重复次数,再利用大根堆选出重复次数最多的1 0个查询串


    正确答案:C

  • 第15题:

    公安搜索引擎系统为广大民警提供网页信息的检索查询,并可以为案件串并和业务专题分析提供技术支持。


    正确答案:正确

  • 第16题:

    根据用户的查询在索引库中快速检索出文档,进行文档与查询的相关度评价是搜索引擎中的()


    正确答案:检索器

  • 第17题:

    使用哪个方法,用户发送的表单数据输入作为URL中的查询字符串传递给服务器()。

    • A、GET方法
    • B、HEAD方法
    • C、PUT方法
    • D、POST方法

    正确答案:A

  • 第18题:

    下列表示查询说法错误的是:()

    • A、参数查询是指在查询中要输入查询参数
    • B、在参数查询中可以不运用Parameters参数集合和Parameter参数对象
    • C、利用查询就是把放在ASP中的SQL语句事先写在数据库的查询中,加快查询操作的速度。
    • D、使用Command对象的Execute方法可执行在对象的CommandText属性中指定的查询。

    正确答案:B

  • 第19题:

    给出了如下的查询条件字符串String condition="insert book values(?,?,?,?,?)";下列哪个接口适合执行该SQL查询()。

    • A、Statement
    • B、PrepareStatement
    • C、CallableStatement

    正确答案:B

  • 第20题:

    判断题
    使用Request对象的QueryString集合可以检索HTTP查询字符串中变量的值。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第21题:

    单选题
    关于HTTP查询字符串,下面说法错误的是:()
    A

    使用Request对象的Query String集合可检索HTTP查询字符串中变量的值

    B

    当通过HTML表单提交数据时,若将表单的METHOD属性设置为POST,则表单数据将附加在查询字符串中被发送到服务器端

    C

    使用A标记创建超级链接时,可以将查询字符串放在URL后面,并使用“?”来分隔URL与查询字符串

    D

    若要通过查询字符串发送多个变量,应使用“&”符号分隔各个变量


    正确答案: B
    解析: 暂无解析

  • 第22题:

    多选题
    下列关于字符串的描叙中错误的是()。
    A

    字符串是对象

    B

    String对象存储字符串的效率比StringBuffer高

    C

    可以使用StringBuffer sb=这里是字符串声明并初始化StringBuffer对象sb

    D

    String类提供了许多用来操作字符串的方法:连接,提取,查询等


    正确答案: D,C
    解析: 暂无解析

  • 第23题:

    填空题
    根据用户的查询在索引库中快速检索出文档,进行文档与查询的相关度评价是搜索引擎中的()

    正确答案: 检索器
    解析: 暂无解析