🐛 Fix honkai web parse

2024-11-27 18:04:03 +00:00 · 2023-07-05 11:17:18 +08:00 · 2023-07-05 11:17:18 +08:00 · 7b19618fcd
commit 7b19618fcd
parent f21a6d6ae3
1 changed files with 25 additions and 19 deletions
--- a/models/honkai.py
+++ b/models/honkai.py
@ -8,12 +8,13 @@ from bs4 import BeautifulSoup, Tag
 from .code import Code, Reward


-url = "https://honkai.gg/cn/codes"
+url = "https://honkai.gg/codes/"
 reward_map = {
    "Stellar Jade": "星琼",
    "Credit": "信用点",
    "Credits": "信用点",
    "Traveler's Guide": "漫游指南",
+    "Traveler’s Guide": "漫游指南",
    "Refined Aether": "提纯以太",
    "Adventure Log": "冒险记录",
    "Dust of Alacrity": "疾速粉尘",
@ -42,11 +43,15 @@ def parse_reward(reward: List[str]) -> Reward:
 def parse_code(tr: Tag) -> Code:
    tds = tr.find_all("td")
    code = tds[0].text.strip()
+    try:
        expire = tds[2].text.strip()
+    except IndexError:
+        expire = datetime(1970, 1, 1, 1, 0, 0, 0)
+    if isinstance(expire, str):
        if expire.endswith("?"):
            expire = datetime(2099, 12, 31, 23, 59, 59, 999999)
        else:
-        expires = expire.split(" - ")
+            expires = expire.split(" – ")
            day = expires[1].split(" ")[-1]
            month = expires[0].split(" ")[0]
            try:
@ -61,8 +66,9 @@ def parse_code(tr: Tag) -> Code:
    expire = timezone("Asia/Shanghai").localize(expire)
    expire = int(expire.timestamp() * 1000)
    rewards = []
-    for reward in tds[1].find_all("div", {"class": "flex"}):
-        reward_div = reward.text.strip().split("\xa0x ")
+    for reward in str(tds[1]).split("<br/>"):
+        reward = BeautifulSoup(reward, "lxml")
+        reward_div = " ".join(reward.text.strip().split()).split(" x ")
        if len(reward_div) < 2:
            print("Bad td data: ", tds[1])
            continue