HBCPC 复盘 - Colton Star Blog

Colton/曹越

公告

标签

Colton/曹越

公告

标签

Colton/曹越

公告

标签

站点统计

文章

19

分类

6

标签

34

总字数

17,478

运行天数

0 天

最后活动

0 天前

3673 字

9 分钟

HBCPC 复盘

2026-05-30

算法

ACM

/

算法

/

总结

热身赛#

动态规划 — 能力闯关问题#

题目大意：初始有 $w$ 点能力值， $x$ 枚金币。依次闯过 $n$ 个关卡，每关包含课程和考试两个阶段：

学习课程需花费 $c_i$ 金币，获得 $\Delta w_i$ 能力值提升
考试得分 = 当前能力值

求在金币有限的前提下，最大化考试总得分。

赛时思路：用两个状态做滚动数组——选这门课 / 不选这门课，转移到下一门课。方向是对的，但当时没做出来。

问题分析：

每关的决策影响后续所有关卡的收益，这也是赛时卡住的核心——能力值是动态变化的，朴素 DP 需要同时记录「当前能力值」和「剩余金币」，维度太高。

关键转化：

总得分 = $\sum_{k=1}^{n}$ （初始 $w$ + 第 $k$ 关之前所有已学课程的 $\Delta w$ 之和）

拆开来看，初始 $w$ 贡献固定为 $w \times n$ 。而每个课程 $\Delta w_i$ 的贡献取决于它被学完之后，后面还剩多少关考试——即每学一门课，它会在之后每一关都发挥作用。

因此第 $i$ 关的课程贡献 = $\Delta w_i \times (n - i)$ 。 $(n - i)$ 其实就是后缀和——第 $i$ 关之后还剩多少关考试，这门课的提升会在之后每一关都生效。

这就转化成了 01 背包问题：

物品：每个关卡一门课
价值： $\Delta w_i \times (n - i)$ （后缀关卡数）
重量： $c_i$
目标：背包容量 $x$ 内总价值最大

状态转移：

1
// dp[j] = 剩余 j 金币时的最大额外得分
2
int dp[x + 1] = {0};
3

4
for (int i = 0; i < n; i++) {
5
    int value = delta_w[i] * (n - i);  // 后续关卡数
6
    int cost = c[i];
7
    for (int j = x; j >= cost; j--) {
8
        dp[j] = max(dp[j], dp[j - cost] + value);
9
    }
10
}
11

12
int ans = w * n + dp[x];  // 基础分 + 额外分

反思：思路本身是对的（01 背包 + 滚动数组），赛时卡住的点在于没有把「能力值提升」正确换算成「总得分增量」。正确做法是算 $\Delta w_i \times$ 剩余关卡数，而不是在 DP 里维护能力值这个维度。

正式赛#

交互题 — 二进制数中 1 的个数#

题目大意：交互器生成一个长度为 $N$ 的二进制串（ $N \le 2^{17}$ ）。你最多有 $17$ 次查询机会。每次查询选择一个下标集合 $S$ ，交互器返回：

\text{ans} = \text{cnt}(S) \times \text{cnt}(\complement S)

其中 $\text{cnt}(X)$ 表示集合 $X$ 中值为 $1$ 的位数， $\complement S$ 是 $S$ 的补集。

目标：求出整个二进制串中 $1$ 的总数 $K$ 。

关键观察：

设总共有 $K$ 个 $1$ ，查询集合 $S$ 中有 $x$ 个 $1$ ，补集中有 $K-x$ 个 $1$ 。交互器返回：

P = x \cdot (K - x)

这是一个关于 $x$ 的二次方程： $x^2 - Kx + P = 0$ ，解得：

x = \frac{K \pm \sqrt{K^2 - 4P}}{2}

即 $x$ 要么是某个值 $c$ ，要么是 $K - c$ 。

查询策略 — 为什么二进制分组可行：

将 $N$ 个位置从 $0$ 开始编号。第 $j$ 次查询（ $0 \le j \le 16$ ）选择所有「下标第 $j$ 位为 $1$ 」的位置：

1
查询 j: 所有满足 (i >> j) & 1 == 1 的位置 i

核心思想：二进制位的正交性。

每个下标 $i$ 有一个唯一的 $17$ 位二进制表示。第 $j$ 位是 $1$ 还是 $0$ ，决定了 $i$ 是否进入第 $j$ 次查询的集合。这就像傅里叶变换里的 $\sin$ 和 $\cos$ 基函数——它们是正交的：

不同二进制位之间的 $0/1$ 标记天然构成了一组正交基。每一位的查询独立地刻画了全体 $1$ 在该位上的分布特征，互不干扰。

换个角度理解：对于任意两个不同的下标 $i \neq i'$ ，它们的二进制表示至少有一位不同，即至少存在一次查询 $j$ ，使得「 $i$ 进入查询 $j$ 而 $i'$ 不进入」（或反之）。

这意味着：不存在两个下标在所有 $17$ 次查询里有完全相同的进出模式。每个位置的「 $17$ 位查询签名」就是它自身编号的二进制表示，天然不重复。

这正是正交性的直观含义——每次查询在不同的「维度」上切分下标空间， $17$ 个维度互不重叠、互不包含，共同唯一确定了 $2^{17}$ 个位置。

信息论视角：

这个问题本质上是一个信息传输问题。二进制串有 $K$ 个 $1$ ，相当于要从 $N$ 个位置中恢复 $K$ 这个整数。 $K$ 的取值范围是 $[0, N]$ ，用二进制表示需要 $\log_2(N+1)$ 比特的信息。

每次查询返回一个乘积 $P_j = c_j(K - c_j)$ 。由于我们不知道 $c_j$ ，单次查询并不能直接传递 $\log_2 N$ 比特——但 $P_j$ 本身是一个非负整数，且与 $K$ 和 $c_j$ 同时相关。在正确的分组策略下，每条查询提供了约 $1$ 比特的有效信息（确定 $c_j$ 在两个可能值中的哪一个）， $17$ 条恰好传递 $17$ 比特，刚好覆盖 $\log_2 N \le 17$ 的信息量上限。

而模余数分组之所以失败，从信息论看是因为查询之间存在互信息（mutual information）：

I(\text{Query}_j; \text{Query}_{j-1}) \gg 0

嵌套结构导致后一条查询的信息大部分已被前一条包含， $17$ 次查询实际提供的独立信息远小于 $17$ 比特，不足以确定 $K$ 。二进制分组则保证了：

I(\text{Query}_j; \text{Query}_{k}) \approx 0 \quad (j \neq k)

查询之间的互信息接近于零，每次查询的 $1$ 比特信息都是新鲜的——这就是正交性在信息论下的等价表述。

赛时为什么走了弯路：

我当时用的策略不是按二进制位分组，而是按模余数分组：

1
第 0 次查询: i % 2 == 1          （除以 2 余 1）
2
第 1 次查询: i % 4 == 1 或 2     （除以 4 余 1,2）
3
第 2 次查询: i % 8 ∈ {1,2,3,4}  （除以 8 余 1,2,3,4）
4
...

这个方案的问题在于：这些查询不是正交的。第 $j$ 次查询的集合并不能表示为「所有第 $j$ 位为 $1$ 的位置」——它们之间存在大量重叠和包含关系，导致不同查询给出的方程冗余，无法独立提供信息。

具体来说，按模 $2^k$ 分组时，第 $k$ 次查询的集合完整包含了第 $k-1$ 次查询的集合，形成了嵌套结构。这意味着：

$c_0 \subseteq c_1 \subseteq c_2 \subseteq \dots$
各次查询高度耦合，信息量远不如二进制分组

而二进制分组保证了 $17$ 次查询完全独立——每次查询给出的 $P_j = c_j(K - c_j)$ 在信息论意义下是互不冗余的，这正是正交性的威力。

求解步骤（逐步详解）#

拿到 $17$ 个 $P_j$ 之后，怎么求出 $K$ ？分三步走。

第一步：写出每条查询提供的方程

对于第 $j$ 次查询，设集合内恰有 $c_j$ 个 $1$ ，则：

P_j = c_j \cdot (K - c_j) \tag{1}

注意： $c_j$ 和 $K$ 都是未知数。一条二次方程有两个未知数，无法直接解出。但 $17$ 条方程共享同一个 $K$ ，这个公共约束就是突破口。

第二步：把每条方程改写成 $c_j$ 关于 $K$ 的表达式

将 $(1)$ 整理为标准二次形式：

c_j^2 - K \cdot c_j + P_j = 0

用求根公式解出 $c_j$ ：

c_j = \frac{K \pm \sqrt{K^2 - 4P_j}}{2} \tag{2}

此时的未知数只剩 $K$ 。但直接解这 $17$ 个联立方程很麻烦，更简单的做法是——枚举 $K$ ，逐一验证。

第三步：枚举 $K$ ，验证自洽性

$K$ 的范围是 $[0, N]$ 。对每个候选 $K$ ，检查两条：

条件 A： $K^2 - 4P_j$ 必须是完全平方数。设 $s_j = \sqrt{K^2 - 4P_j}$ ，则 $s_j$ 必须是整数。

因为 $c_j$ 是 $1$ 的个数，必须是整数。而根据 $(2)$ ， $c_j$ 是整数当且仅当 $\sqrt{K^2 - 4P_j}$ 是整数。

条件 B： $c_j = (K - s_j)/2$ 必须在 $[0, K]$ 内。

取减号那支就够了——另一支 $(K + s_j)/2$ 其实就是 $K - c_j$ ，是同一个值从补集视角看。

如果 $17$ 条方程全部通过，这个 $K$ 就是答案。

为什么枚举可行？

枚举量是 $O(N)$ ，每条方程检查是 $O(1)$ ，总计 $O(17N)$ 。题目中 $N \le 2^{17} \approx 1.3 \times 10^5$ ， $17N \approx 2.2 \times 10^6$ ，完全在时限内。

可以加速： $P_0$ 的方程 $c_0(K - c_0) = P_0$ 已经大大限制了 $K$ ——不是每个 $K$ 都能让 $K^2 - 4P_0$ 成为完全平方。实际枚举时绝大多数 $K$ 在第一轮就因判别式不满足而被跳过。

代码对应关系：

1
// 对每个候选 K
2
for (int K = 0; K <= n; K++) {
3
    bool ok = true;
4
    for (int j = 0; j < 17; j++) {
5
        // 条件 A：判别式是完全平方
6
        long long disc = 1LL * K * K - 4 * P[j];
7
        if (disc < 0)      { ok = false; break; }  // 不含实根
8
        long long sq = sqrt(disc);
9
        if (sq * sq != disc) { ok = false; break; } // 不是完全平方
10

11
        // 条件 B：c_j 在合法范围内
12
        long long c = (K - sq) / 2;
13
        if (c < 0 || c > K)  { ok = false; break; }
14
    }
15
    if (ok) {
16
        cout << "! " << K << endl;  // ← 找到答案
17
        return 0;
18
    }
19
}

直观理解：

想象你手里有 $17$ 条「规则」，每条规则说「如果你告诉我总共有 $K$ 个 $1$ ，我就能告诉你第 $j$ 位为 $1$ 的那些位置里有多少个 $1$ 」。你挨个试 $K = 0, 1, 2, \dots, N$ ，看哪个 $K$ 能让所有 $17$ 条规则同时说得通。只有真正的 $K$ 能让所有方程同时给出整数解——这就是自洽性检验。

参考代码：

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
int query(const vector<int>& s) {
5
    if (s.empty()) return 0;
6
    cout << "? " << s.size();
7
    for (int x : s) cout << " " << x;
8
    cout << endl;
9
    int ans; cin >> ans;
10
    return ans;
11
}
12

13
int main() {
14
    int n;
15
    cin >> n;  // 二进制串长度
16

17
    // 17 次查询：按二进制位分组
18
    vector<long long> P(17);
19
    for (int j = 0; j < 17; j++) {
20
        vector<int> s;
21
        for (int i = 0; i < n; i++) {
22
            if ((i >> j) & 1) s.push_back(i);
23
        }
24
        P[j] = query(s);
25
    }
26

27
    // 枚举 K（总共有 K 个 1），验证所有方程是否自洽
28
    for (int K = 0; K <= n; K++) {
29
        bool ok = true;
30
        for (int j = 0; j < 17; j++) {
31
            long long disc = 1LL * K * K - 4 * P[j];  // 判别式
32
            if (disc < 0) { ok = false; break; }
33
            long long sq = sqrt(disc);
34
            if (sq * sq != disc) { ok = false; break; }
35
            // c 必须是整数且在 [0, K] 范围内
36
            long long c = (K - sq) / 2;
37
            if (c < 0 || c > K || c * (K - c) != P[j]) {
38
                ok = false; break;
39
            }
40
        }
41
        if (ok) {
42
            cout << "! " << K << endl;
43
            return 0;
44
        }
45
    }
46
    return 0;
47
}

注意：实际交互中 $N$ 可能较大，枚举 $K$ 时可以利用「 $P_0 = c_0(K - c_0)$ 且 $c_0$ 为整数」直接缩小 $K$ 的候选范围，避免 $O(N)$ 枚举。

奇技淫巧：随机单点查询#

除了正统的二进制分组，还有一种「非正统」做法——随机单点查询，赛场上确实有人靠运气过了这道题。

原理极其简单：

每次随机选一个位置 $i$ ，只查询这一个位置。设该位的值为 $a_i$ ，交互器返回：

\text{ans} = a_i \cdot (K - a_i) = \begin{cases} 0 & \text{如果 } a_i = 0 \\ K-1 & \text{如果 } a_i = 1 \end{cases}

如果返回 $0$ ：没抽中 $1$ ，再来一次。
如果返回正数：恭喜，抽中了一个 $1$ ！此时 $K = \text{ans} + 1$ ，直接出答案。

1
// 随机抽奖
2
mt19937 rng(random_device{}());
3
for (int t = 0; t < 17; t++) {
4
    int i = uniform_int_distribution<>(0, n - 1)(rng);
5
    int ans = query({i});  // 只查这一个位置
6
    if (ans > 0) {
7
        cout << "! " << ans + 1 << endl;
8
        return 0;
9
    }
10
}

期望分析：

设 $K$ 个 $1$ 均匀分布在 $N$ 个位置中，每次抽中 $1$ 的概率是 $p = K/N$ 。在 $17$ 次机会内至少抽中一次的概率为：

P_{\text{成功}} = 1 - (1 - K/N)^{17}

若 $K \ge N/4$ ：概率 $\ge 1 - (0.75)^{17} \approx 99.3\%$
若 $K = N/10$ ：概率 $\approx 1 - (0.9)^{17} \approx 83\%$
若 $K = 1$ ：概率 $\approx 17/N$ ，基本看命

换句话说，只要 $1$ 不是太稀疏，这招靠的是大数定律+运气，不需要任何数学推导。

严肃评价：这不是正确做法，不值得提倡。但它确实生动地说明了一件事——交互题中，单点查询本身就是最直接的信息获取方式，正是「查询一个集合」这个更一般的形式把问题变复杂了，才有了二进制分组的用武之地。

E. 电梯#

题目大意：大楼有 $n$ 层，第 $1$ 到第 $n$ 层。建 $m$ 个电梯，每个电梯必须停第 $1$ 层和第 $n$ 层，中间可选停。要求：对于任意不同的两层 $x,y$ ，存在一个电梯使得 $x,y$ 可以直达（中间不经停任何其它楼层）。求 $m$ 的最小值并构造。

约束： $n \le 1000$ ，总停次数 $\le 2 \times 10^6$ 。

问题转化：每个电梯 = 一条从 $1$ 到 $n$ 的严格递增路径，路径的每条边（相邻停靠对）就是可直达的楼层对。我们需要用 $m$ 条路径覆盖 $K_n$ 的全部 $C(n,2)$ 条边。

下界分析：

每条电梯恰好有一条首边 $(1, a_2)$ 和一条末边 $(a_{k-1}, n)$ 。要覆盖所有涉及 $1$ 的楼层对 $(1,2),(1,3),\dots ,(1,n)$ ，至少需要 $n-1$ 个不同的电梯（每个只能贡献一条首边）。

同理，要覆盖所有 $(2,n),(3,n),\dots ,(n-1,n)$ ，至少 $n-1$ 条末边。但 $(1,n)$ 兼为首边和末边，可被同一个电梯覆盖。所以：

m \ge n - 1

但这只是「首末边覆盖」的下界。还剩内部对 $(i,j)$ 满足 $2 \le i < j \le n-1$ 且 $j-i \ge 2$ ，这些必须被某条电梯的中间边覆盖。

内部对共 $C(n-2, 2)$ 个，每个电梯至多贡献 $n-3$ 条中间边，这给出了更强的下界：

m \ge n - 1 + \left\lceil \frac{2 \cdot C(n-2, 2)}{n-3} \right\rceil

实际最小值更接近 $\left\lfloor \dfrac{n^2}{4} \right\rfloor$ （验证了小 $n$ ）。

小 $n$ 验证：

$n$	$m_{\min}$	$\lfloor n^2/4 \rfloor$
2	1	1
3	2	2
4	4	4
5	6	6

构造方法（以 $n=5,m=6$ 为例）：

每部电梯可以理解为一个「分段方案」，它将 $[1,n]$ 切成若干子区间：

1
E₁: 1 → 2 → 3 → 4 → 5   首边(1,2), 内部(2,3)(3,4), 末边(4,5)
2
E₂: 1 → 3 → 5            首边(1,3), 末边(3,5)
3
E₃: 1 → 2 → 4 → 5        首边(1,2), 内部(2,4), 末边(4,5)
4
E₄: 1 → 4 → 5            首边(1,4), 末边(4,5)
5
E₅: 1 → 5                首边(1,5) = 末边
6
E₆: 1 → 2 → 5            首边(1,2), 末边(2,5)

E₁ 完成所有「相邻层」的覆盖（gap=1），E₅ 完成 $(1,n)$ 。E₂-E₄ 和 E₆ 覆盖跨 gap ≥ 2 的对。

每部电梯的首边在 $(1,\cdot )$ 集合中、末边在 $(\cdot ,n)$ 集合中各认领一个任务；中间段则负责跨层直达。

本人更喜欢的做法 — 贪心 DFS：

核心思路非常直觉：从 $1$ 出发，每步找一个「还没被覆盖直达关系」的楼层跳过去，直到连到 $n$ ，一部电梯生成完毕。如果还有未覆盖的楼层对，就再生成一部新电梯。重复直到所有对都被覆盖。

1
while (还有未覆盖的楼层对):
2
    cur = 1, path = [1]
3
    while (cur != n):
4
        nxt = 第一个 (cur, nxt) 还没被覆盖的楼层
5
        如果不存在 → nxt = n  （退化为直达 n）
6
        标记 (cur, nxt) 已覆盖
7
        path.push_back(nxt)
8
        cur = nxt
9
    ans.push_back(path)     ← 一部电梯完成

完整代码：

1
#include <bits/stdc++.h>
2
using namespace std;
3

4
const int N = 1010;
5
int n;
6
bool covered[N][N];           // (i,j) 是否已被某部电梯覆盖
7
vector<vector<int>> ans;      // 所有电梯
8

9
// 从 1 出发，贪心构建一部电梯直到 n
10
vector<int> build_elevator() {
11
    vector<int> path;
12
    path.push_back(1);
13
    int cur = 1;
14

15
    while (cur != n) {
16
        int nxt = -1;
17
        for (int j = cur + 1; j <= n; j++) {
18
            if (!covered[cur][j]) { nxt = j; break; }
19
        }
20
        if (nxt == -1) nxt = n;                // 退化为直达
21
        covered[cur][nxt] = covered[nxt][cur] = true;
22
        path.push_back(nxt);
23
        cur = nxt;
24
    }
25
    return path;
26
}
27

28
int main() {
29
    cin >> n;
30

31
    // 只要还有未覆盖的对，就继续建新电梯
32
    while (true) {
33
        bool all_covered = true;
34
        for (int i = 1; i <= n && all_covered; i++)
35
            for (int j = i + 1; j <= n; j++)
36
                if (!covered[i][j]) { all_covered = false; break; }
37
        if (all_covered) break;
38

39
        ans.push_back(build_elevator());
40
    }
41

42
    cout << ans.size() << "\n";
43
    for (auto& e : ans) {
44
        for (size_t i = 0; i < e.size(); i++)
45
            cout << (i ? " " : "") << e[i];
46
        cout << "\n";
47
    }
48
}

运行示例 ( $n=4$ )：

贪心 DFS 不保证 $m$ 最小（复杂度 $O(n^3)$ 内跑完 $n \le 1000$ ），但它直观、好写、可读性强，赛场上能快速拿到一个可行解。顺带提一句，我在考场上思路是没问题的，就是码力不太够，缺少将思路转换为代码的能力，解决这个问题必须多阅读代码，多敲代码。

总结：

考点	说明
构造 + 覆盖	把「直达」条件转化为路径覆盖 $K_n$
下界	首边/末边 + 中间对数，给出 $m \ge$ 推导
小规模推理	$n \le 1000$ ，枚举推导或递归构造均可

二分答案 — 雪糕生产线#

这一题意难平。开赛时看到很多人都迅速过了，心想这题应该很简单，结果罚时两发，遗憾没有省一。

题意：有 $n$ 台机器，第 $i$ 台生产一根雪糕需要 $t_i$ 分钟。问生产 $m$ 根雪糕至少需要多少分钟。

本来思路（错）：算速度——拿 $1/t_i$ 表示第 $i$ 台机器每分钟能做多少根，然后累加求总速度。但这里有浮点陷阱：假如两台机器各每分钟做 $0.5$ 根， $0.5+0.5=1$ ，看起来一分钟能做一根。但实际上每台机器独立工作 1 分钟，第一根雪糕在哪台都没完成（ $1 < t_i$ ），一根都出不来。

正解：二分时间 $T$ ，检验在 $T$ 分钟内能否生产 $\ge m$ 根。第 $i$ 台机器的产量 = $\lfloor T / t_i \rfloor$ （整数除法）。

1
#include <bits/stdc++.h>
2
using namespace std;
3
typedef long long ll;
4

5
const int N = 1e6 + 5;
6
int n, m;
7
int t[N];
8

9
// 检查在 k 分钟内能否生产 m 根
10
bool check(ll k) {
11
    ll cnt = 0;
12
    for (int i = 0; i < n; i++) {
13
        cnt += k / t[i];
14
        if (cnt >= m) return true;    // 提前剪枝，防爆 long long
15
    }
16
    return cnt >= m;
17
}
18

19
int main() {
20
    cin >> n >> m;
21
    for (int i = 0; i < n; i++) cin >> t[i];
22

23
    ll l = 0, r = 1e18, ans = -1;     // r 开大：m 根 × 最慢机器
24
    while (l <= r) {
25
        ll mid = l + (r - l) / 2;
26
        if (check(mid)) {
27
            ans = mid;
28
            r = mid - 1;
29
        } else {
30
            l = mid + 1;
31
        }
32
    }
33
    cout << ans << "\n";
34
    return 0;
35
}

考点	说明
二分答案	最优值问题 → 判定问题， $O(\log \text{max})$
整数二分	用 `ll` 防溢出，右界设为 `1e18`
浮点陷阱	$\sum 1/t_i$ 的整数部分 $\neq$ 实际能完成的根数

总结#

做得好的：热身赛 DP 题虽然没出，但赛后很快找准了”后缀和”转化 + 01 背包的正确框架；交互题的正交性理解到位
需要改进的：
- 「思路 → 代码」的翻译能力不足，思路有了但写出来就有细节 bug
- 简单题心态不稳，看别人秒过就急着交，罚时不值
- 二分答案这种基础题应该零失误，边界条件和数据类型多检查
下一步计划：赛后定期打 CF 保持手感，重点练交互题和构造题的类型积累 以上就是本次比赛中对我而言有帮助的题目，其他的题目还没来得及看故而不进行分析

如果这篇文章对你有帮助，欢迎分享给更多人！

HBCPC 复盘

https://caoyue.xin/posts/hbcpc-review/

作者

Colton/曹越

发布于

2026-05-30

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

归并排序与逆序对统计

快速幂

Colton Star Blog

热身赛#

动态规划 — 能力闯关问题#

正式赛#

交互题 — 二进制数中 1 的个数#

求解步骤（逐步详解）#

奇技淫巧：随机单点查询#

E. 电梯#

二分答案 — 雪糕生产线#

总结#

目录