荷马史诗

题目

追逐影子的人,自己就是影子。 ——荷马

达达最近迷上了文学。

她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。

但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。

达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:

对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。

现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?

一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。

字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。

其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入格式

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

第2~n+1 行:第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

输出格式

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

数据范围

2≤n≤100000,
2≤k≤9

输入样例:

4 2
1
1
2
2

输出样例:

12
2

分析

  • 模拟哈夫曼树的形成过程,每次选k个最小的结点合并即可。
  • 但是要注意一点,k结点的哈夫曼树中除了最下面一层结点,每个结点都有k个子节点,其中一个是空节点,所以就是如果(n-1)%(k-1)!=0,这样合并不会形成最优解,因为靠近根节点的时候,没有k个结点了,这样会造成将离根节点近的,即短的数量还少一些,所以我们可以加入值为零的结点,将它凑成(n-1)%(k-1)==0。这样每层都会铺满k个结点,并且零结点不会影响答案

    代码

#include <iostream>
#include <algorithm>
#include <queue>
#include <vector>
using namespace std;
typedef long long ll;
typedef pair<ll,ll> PLL;
ll n,k;

int main()
{
    cin>>n>>k;
    priority_queue<PLL,vector<PLL>,greater<PLL>> q;
    for(int i=0;i<n;i++){
        ll x;
        cin>>x;
        q.push({x,0});
    }
    while((q.size()-1)%(k-1)!=0) q.push({0,0});

    ll ans=0;
    while(q.size()>1){
        ll deep=-1,sum=0;
        for(int i=0;i<k;i++){
            auto x=q.top();q.pop();
            deep=max(deep,x.second); 
            sum+=x.first;
        }
        ans+=sum;
        q.push({sum,deep+1});
    } 

    cout<<ans<<endl;
    cout<<q.top().second<<endl;
    return 0; 
}

   转载规则


《荷马史诗》 蒋曾辉 采用 知识共享署名 4.0 国际许可协议 进行许可。
 上一篇
数据备份 数据备份
你在一家IT公司为大型写字楼或办公楼的计算机数据做备份。
2019-08-29
下一篇 
城市游戏 城市游戏
有一天,小猫rainbow和freda来到了湘西张家界的天门山玉蟾宫,玉蟾宫宫主蓝兔盛情地款待了它们,并赐予它们一片土地。
2019-08-27
  目录