Learn Japanese with JapanesePod101.com

View topic - Question for Jim Breen et al about KANJIDIC2

Question for Jim Breen et al about KANJIDIC2

The test - experiences, questions or comments

Question for Jim Breen et al about KANJIDIC2

Postby phreadom » Sun 12.04.2011 10:37 am

I thought this was an ok place to post this since it directly relates to the JLPT levels...

Since the 2010 update to the new 5 level system (N5 through N1 instead of 4 through 1), is there enough info now to make an update to KANJIDIC2 for the JLPT level data?

I'm interested in using the KANJIDIC2 information, but would rather use the new 5 level JLPT information than the old (now deprecated) 4 level system.

A few questions come up surrounding this... for instance, is the current 4 level data in KANJIDIC based on the official JLPT Test Content Specifications released for the old 4 level system? ( from http://www.csse.monash.edu.au/~jwb/kanjidic_doc.html - "J<num> -- the level of the Japanese Language Proficiency Test (JLPT) in which the kanji occurs. (1-4)" )

Would the new levels be named N5 - N1 rather than the current 4 - 1 numbering?

Do we have enough data from the tests thus far under the new system to compile a good enough usage list to update the KANJIDIC JLPT info?

And perhaps finally, but worth mentioning, is it really worth it to add this information given the new admonition against using such study aids in the first place? I'd still like to have this information available either way... but given the slight change in stance, I felt it worth mentioning.

I'd be willing to do the manual labor myself on this if needed. :)

<!-- Entry for Kanji: 亜 -->
<character>
<literal>亜</literal>

... >8 snip >8 ...

<misc>
<grade>8</grade>
<stroke_count>7</stroke_count>
<variant var_type="jis208">48-19</variant>
<freq>1509</freq>
<jlpt>1</jlpt> ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← :!:
</misc>

... and so on...


Danaduck posted a list of the new N5-N1 kanji over on koohii.com;

danaduck wrote:n5 kanji:
一 二 三 四 五 六 七 八 九 十 日 月 白 百 中 千 上 下 見 万 左 右 子 女 母 小 大 外 名 川 水 土 時 火 木 本 先 金 車 前 高 学 書 話 語 読 雨 天 北 毎 東 電 午 国 友 出 山 入 男 行 人 休 何 年 半 父 校 後 食 生 今 西 南 間 聞 円 来 気 長

n5 extra primitives (only using data from rtk1):
口 田 目 吾 舌 寸 乙 工 刀 丁 可 夕 寺 未 牛 王 玉 士 売 言 衣 匕 亀 又 耳 力 交 良 門


n4 kanji:
口 田 目 古 明 品 早 世 自 朝 員 元 真 工 有 切 別 町 兄 少 多 夕 魚 黒 同 字 安 味 妹 犬 牛 特 界 茶 理 主 注 道 夏 運 京 週 売 言 計 試 止 歩 正 走 題 建 姉 転 冬 立 海 歌 音 方 地 風 起 家 場 洋 着 集 習 曜 店 心 思 意 手 持 研 広 台 始 去 会 室 公 堂 死 買 力 待 秋 私 答 住 体 仕 使 代 貸 花 肉 以 夜 旅 物 屋 昼 社 近 質 作 急 事 画 料 図 用 借 度 不 族 知 帰 強 弟 写 考 教 者 足 院 空 究 終 服 通 銀 飯 飲 館 新 親 青 春 漢 野 問 開 重 動 病 医 発 文 楽 英 映 赤 色 業 悪 紙 鳥 勉 験 駅 送

n4 extra primitives (only using data from rtk1):
旦 占 貝 頁 首 石 里 完 介 合 軍 周 式 是 市 欠 虫 己 羊 羽 史 吏 反 至 米 竹 化 内 丙 勿 尺 示 由 斤 斗 昔 廿 矢 弓 弘 与 老 孝 官 穴 糸 辛 予 央 並 亜 氏 免 馬


n3 kanji:
負 首 直 具 頂 好 石 光 太 原 願 泳 活 消 点 向 守 完 寄 富 相 未 末 若 草 苦 葉 暮 状 然 猫 告 洗 合 王 現 全 逃 連 格 客 処 落 夢 景 覚 敗 警 調 談 式 成 政 定 越 遠 初 市 制 商 適 背 皆 腹 欠 吹 次 資 暗 識 亡 望 訪 放 説 増 歳 記 美 達 差 進 雑 確 許 権 観 困 因 園 回 庭 忘 認 想 息 恐 感 忙 怖 慣 必 議 抱 招 打 指 掛 才 財 存 在 吸 更 怒 抜 投 支 反 返 浮 受 愛 払 治 窓 法 到 互 育 流 込 貧 容 欲 常 破 残 列 耳 取 最 恥 職 置 夫 規 賛 失 労 努 加 得 徒 彼 役 程 和 利 米 迷 数 類 様 求 球 笑 箱 等 位 件 他 伝 信 例 側 値 倒 便 優 宿 付 任 化 内 座 似 遊 易 居 局 遅 戻 示 礼 福 察 由 押 申 神 果 所 折 断 昨 雪 寝 婦 当 争 君 両 満 歯 曲 科 備 昔 散 席 渡 判 勝 否 杯 務 引 費 号 与 老 追 師 官 交 路 過 際 陽 降 突 探 深 緒 続 絵 給 経 約 幾 機 係 御 命 冷 疑 犯 危 留 酒 配 頭 喜 盗 退 限 良 娘 平 呼 殺 辞 幸 報 収 熱 刻 術 寒 精 情 晴 静 責 積 表 害 割 性 産 実 勤 難 乗 念 予 要 煙 閉 非 悲 罪 候 決 偉 違 余 除 途 束 頼 速 険 働 種 疲 痛 迎 登 形 顔 参 対 済 薬 変 横 絶 期 舞 組 祖 助 共 供 港 選 解 構 論 婚 民 眠 捕 部 都 段 船 飛 妻 面 靴 声 誤 番 宅 髪 単 戦 鳴 偶 晩 馬 能 演 関

n3 extra primitives (only using data from rtk1):
升 丸 凡 句 勺 刃 召 則 貫 肖 奇 永 泉 圭 炎 苗 兆 呈 各 敬 布 比 旨 曽 廷 包 忍 憂 我 義 及 奴 爪 分 谷 皮 戸 祭 甲 矛 系 卸 令 厄 酉 豆 皿 亥 侯 彦 斉 黄 甘 洪 角 再 舟 革 呉 毛 寅 且


n2 kanji:
胃 旧 昇 丸 専 占 貝 児 肌 乱 召 則 副 了 砂 省 厚 州 順 氷 永 泉 況 河 泊 湖 測 圧 封 寺 均 灯 灰 照 漁 量 埋 貯 林 森 植 枯 村 机 札 燥 薄 兆 介 塔 玉 宝 柱 銅 針 導 造 辺 輸 各 略 額 軍 涼 周 栄 枚 敬 訓 詰 域 城 減 浅 肯 歴 武 超 延 衣 装 裏 布 幅 帽 帯 刺 芸 雲 曇 橋 章 競 童 滴 比 混 脂 乾 複 軟 境 荒 鋭 贈 凍 燃 県 池 虫 改 包 湯 準 羽 翌 濯 固 団 庫 庁 床 磨 誌 患 憎 捨 損 拾 担 接 械 鼻 型 材 史 硬 双 隻 設 技 枝 軽 坂 板 販 乳 将 採 菜 鉱 岩 炭 谷 浴 溶 賞 党 皮 波 被 替 鉄 臣 蔵 臓 賢 巨 募 協 律 復 税 移 秒 香 季 委 粉 粒 奥 竹 筆 筒 算 築 仲 仏 依 個 停 億 倍 符 府 袋 貨 傾 荷 久 卒 瓶 営 液 換 泥 掘 層 刷 戸 肩 涙 雇 祝 禁 祭 油 届 伸 捜 菓 課 祈 録 掃 群 焼 券 巻 片 版 柔 弱 沸 汚 著 署 諸 挟 管 効 骨 防 階 兵 糸 線 練 絡 紅 紹 細 総 綿 緑 幼 畜 孫 令 零 齢 領 勇 踊 腕 卵 貿 印 尊 短 豊 皿 血 温 塩 根 希 胸 純 鈍 辛 叫 陸 勢 述 毒 麦 清 績 喫 星 姓 拝 籍 棒 含 預 腰 門 簡 快 干 刊 汗 軒 岸 宇 塗 匹 区 欧 療 珍 央 跡 恋 湾 黄 甘 査 畳 並 普 湿 暴 爆 殿 囲 耕 角 触 再 講 輪 編 冊 低 底 補 郊 郵 伺 詞 舟 航 般 沈 革 蒸 承 極 毛 脳 悩 島 隅 逆 缶 象 像 駐 膚 劇 震 農 濃 咲

n2 extra primitives (only using data from rtk1):
冒 呂 昭 亭 舎 吉 壮 昆 乞 麻 志 串 戒 刑 瓦 尼 屈 丘 玄 宛 凶 契 奉 垂 井 司 虎 辰 屯 卯


n1 kanji:
冒 朋 唱 晶 呂 昌 旭 旦 胆 亘 凹 凸 舌 升 寸 博 卓 只 貞 頑 凡 句 旬 勺 乙 賄 貢 項 刀 刃 昭 丁 孔 如 貫 克 汐 肖 硝 砕 削 器 臭 妙 奇 沼 沖 江 汁 潮 源 吐 垣 圭 涯 炎 煩 淡 災 墨 鯉 厘 洞 胴 尚 宣 宵 宴 桂 枠 梢 棚 杏 桐 朴 暦 案 朱 株 寛 模 漠 墓 膜 苗 桃 眺 黙 狩 珠 狂 皇 呈 栓 銑 鉢 釣 銘 鎮 迅 迫 巡 軌 条 冗 輝 冠 坑 享 塾 熟 亭 鯨 舎 士 吉 壮 荘 津 牧 攻 故 獄 訂 討 詔 詠 詩 諾 諭 弐 賊 栽 載 茂 誠 威 滅 桟 銭 渉 頻 企 賦 証 錠 赴 是 堤 誕 礎 婿 裁 壊 哀 猿 帆 幕 錦 肺 滞 製 雷 霜 泣 帝 瞳 鐘 嫡 敵 昆 渇 謁 褐 喝 旨 壱 敏 梅 炊 姿 諮 賠 培 剖 韻 鏡 盲 妄 妨 芳 肪 激 脱 棟 妊 廷 染 賓 蛍 蛇 虹 蝶 独 蚕 己 妃 胞 砲 泡 亀 竜 滝 豚 逐 遂 嫁 豪 腸 羊 詳 鮮 唯 焦 礁 准 雌 奮 奪 歓 姻 壇 麻 忍 忌 志 忠 恩 応 憩 恵 惑 憂 寡 悦 恒 悼 悟 悔 愉 惰 慎 憾 憶 慕 添 泌 看 摩 我 義 犠 抹 搭 抄 抗 批 拓 拍 拘 拐 摘 挑 括 揮 推 揚 提 拠 描 操 掲 戒 刑 乃 携 及 扱 吏 又 桑 護 獲 奴 没 撃 殻 肢 茎 怪 叔 督 寂 淑 妥 奨 授 拡 弁 雄 怠 胎 至 致 棄 撤 充 銃 硫 允 唆 拙 岐 峠 崩 密 嵐 崎 頒 松 翁 訟 裕 鉛 沿 掌 婆 披 殉 殊 殖 裂 烈 葬 瞬 趣 撮 聖 敢 聴 懐 慢 漫 罰 寧 濁 環 還 扶 渓 潜 迭 姫 堅 臨 覧 拒 劣 功 勧 励 賀 架 脅 従 往 征 径 徳 徹 徴 懲 微 街 衡 稿 稼 稚 愁 秩 秘 称 梨 穫 穂 稲 秀 透 誘 穀 菌 粘 粋 糧 菊 楼 漆 救 笹 筋 策 簿 佐 但 悠 伏 仮 伯 俗 佳 健 侍 倣 偵 僧 儀 償 仙 催 仁 侮 伐 傷 保 褒 傑 賃 俊 傍 畝 囚 丙 柄 腐 傘 匁 併 宮 善 塚 幣 弊 喚 融 施 旋 賜 尿 尼 塀 履 握 屈 堀 据 漏 尺 尽 沢 訳 択 房 扇 炉 顧 啓 祥 祉 視 奈 尉 慰 款 襟 宗 崇 擦 抽 宙 笛 軸 甲 岬 挿 裸 斤 析 哲 逝 誓 暫 漸 斥 訴 詐 尋 穏 侵 浸 浄 糖 康 逮 伊 耐 需 儒 端 曹 遭 槽 斗 庸 錯 惜 措 庶 遮 奔 噴 墳 憤 暁 伴 畔 圏 藤 謄 之 乏 芝 矢 矯 智 矛 霧 班 弓 弔 弘 第 巧 朽 誇 射 謝 拷 煮 暑 猪 渚 峡 狭 帥 棺 較 促 距 露 跳 躍 践 踏 滑 髄 禍 渦 阿 障 随 陪 陳 附 陣 隊 墜 陛 隣 隔 隠 堕 陥 穴 控 窒 窃 搾 窯 窮 丘 岳 浜 織 繕 縮 繁 縦 締 維 羅 統 絞 結 級 紀 納 紡 紛 紳 累 索 絹 繰 継 縁 網 緊 紫 縛 縄 幽 玄 蓄 弦 擁 滋 慈 磁 系 懸 却 脚 卸 鈴 擬 凝 範 厄 苑 柳 興 酉 酌 酵 酷 酬 酪 酢 酔 酸 猶 豆 鼓 樹 盆 盟 監 濫 鑑 猛 盛 恨 即 爵 節 眼 朗 浪 飢 餓 飾 養 飽 既 概 慨 坪 評 刈 凶 離 梓 宰 壁 避 薪 執 糾 卑 碑 睦 陵 亥 核 該 劾 醸 譲 壌 嬢 素 請 債 漬 俵 潔 契 轄 憲 牲 隆 峰 縫 鋳 椿 泰 奏 奉 俸 謹 嘆 華 垂 睡 錘 剰 吟 琴 陰 序 兼 嫌 鎌 謙 廉 価 票 漂 標 栗 遷 覆 楠 献 閲 閥 閣 閑 潤 欄 闘 倉 創 俳 排 輩 扉 侯 緯 衛 肝 幹 芋 徐 叙 斜 瀬 勅 疎 整 剣 検 倹 勲 衝 薫 痴 痘 症 疾 痢 疫 癖 匿 匠 枢 殴 抑 仰 澄 廃 僚 寮 彫 影 杉 彩 彰 彦 須 膨 惨 修 診 紋 蚊 斉 剤 斎 粛 塁 率 渋 摂 赦 蛮 把 艶 肥 紺 某 謀 媒 欺 棋 旗 碁 基 甚 勘 堪 貴 遺 遣 粗 租 阻 宜 譜 顕 繊 霊 撲 僕 異 翼 洪 恭 井 亜 購 溝 倫 偏 遍 典 氏 抵 浦 舗 邸 郭 郡 邦 郷 響 郎 廊 盾 循 派 脈 衆 逓 鍛 后 幻 司 飼 嗣 舶 盤 搬 艦 艇 弧 孤 繭 益 暇 敷 汽 衰 衷 覇 呉 娯 芽 邪 雅 釈 審 翻 藩 耗 尾 託 為 偽 張 帳 脹 展 喪 巣 禅 弾 桜 獣 厳 鎖 挙 誉 猟 鶴 蔦 鳩 鶏 暖 媛 援 緩 属 嘱 遇 愚 塑 鋼 綱 剛 陶 揺 謡 就 懇 墾 免 逸 駒 騎 駆 騒 駄 驚 篤 騰 虎 虜 虚 戯 虞 慮 虐 鹿 薦 慶 麗 熊 態 寅 辰 辱 振 娠 唇 鬼 醜 魂 魔 魅 塊 襲 嚇 朕 雰 箇 錬 遵 罷 屯 且 藻 隷 癒 丹 潟 丑 卯 巳 璃 麟 駿 峻 竣 皐 爾 凱 雛 采 也 尭 巴 甫 菫 喬 倭 伶 伽 倖 伎 侃 佑 偲 脩 冴 凌 冶 凪 鳳 啄 叶 唄 邑 嬉 宥 宏 嵩 崚 嶺 嵯 鷹 庄 弥 捺 捷 惟 怜 惇 憧 悌 湧 澪 洸 滉 漱 洲 洵 沙 浩 鴻 汰 淳 渥 茉 莉 萩 蓮 芙 蓉 蘭 菖 蕉 蕗 藍 茄 萌 茅 葵 蒔 芹 蒼 茜 莞 迪 遥 遼 郁 惣 恕 昴 晋 晟 暉 晏 晨 晃 曙 昂 旺 胡 楓 楊 椋 榛 柊 柚 柾 槙 橘 杜 椎 李 樺 栞 椰 檀 槻 彬 毬 燿 燎 燦 瑶 琳 瑠 琉 瑳 琢 瑚 瑞 玖 瑛 玲 眸 瞭 眉 碧 碩 磯 祐 禄 禎 稔 穣 稜 稀 颯

n1 extra primitives (only using data from rtk1):
辻 唐 身 寿 瓜 牙 岡


to which Katsuo replied...

Katsuo wrote:As I've mentioned before on these boards, the JLPT Examination body published a very detailed specification book with lists of kanji, vocabulary and grammar for each level. Since changing to the "N1-5" system they no longer publish it, but it's still the best reference we have.

The kanji specified for level one in the book differs greatly from most lists that are passed around on the Internet. To be specific, their list does not include the 285 name kanji that is included in post from danaduck above. The JLPT's own list can be found in this spreadsheet.

Having said that, both the Joyo kanji and JLPT have had major revisions this year (2010). The previous JLPT list for Level 1 was a modification of the Joyo data published in 1981; they added 114 kanji and removed 19 to reflect current usage. However, as the Joyo kanji list has now been brought up to date I imagine that would be their new reference.


I look forward to your guidance! :bow:
猿も木から落ちる
User avatar
phreadom
Site Admin
 
Posts: 1762
Joined: Sun 01.29.2006 8:43 pm
Location: Michigan, USA
Native language: U.S. English (米語)
Gender: Male

Re: Question for Jim Breen et al about KANJIDIC2

Postby jimbreen » Sun 12.04.2011 8:47 pm

phreadom wrote:I thought this was an ok place to post this since it directly relates to the JLPT levels...

Since the 2010 update to the new 5 level system (N5 through N1 instead of 4 through 1), is there enough info now to make an update to KANJIDIC2 for the JLPT level data?


Good question. I wouldn't mind an answer on that.

I'm interested in using the KANJIDIC2 information, but would rather use the new 5 level JLPT information than the old (now deprecated) 4 level system.

A few questions come up surrounding this... for instance, is the current 4 level data in KANJIDIC based on the official JLPT Test Content Specifications released for the old 4 level system? ( from http://www.csse.monash.edu.au/~jwb/kanjidic_doc.html - "J<num> -- the level of the Japanese Language Proficiency Test (JLPT) in which the kanji occurs. (1-4)" )


Yes, pretty much.

Would the new levels be named N5 - N1 rather than the current 4 - 1 numbering?


I wouldn't want two sets of numbers embedded there.

One thing I DON'T want in an information source such as KANJIDIC is ephemeral data, i.e. codes that change regularly. It's a pain that the latest edition of White Rabbit kanji flashcards went and changed all their numbers. The JLPT levels is another such pain. If, and I think that's a BIG IF, a reliable indication of the kanji appropriate for the new JLPT levels were available, I'd put them in. And yes, they'd replace the current 4-level numbers completely.

Do we have enough data from the tests thus far under the new system to compile a good enough usage list to update the KANJIDIC JLPT info?


I suspect not.

And perhaps finally, but worth mentioning, is it really worth it to add this information given the new admonition against using such study aids in the first place? I'd still like to have this information available either way... but given the slight change in stance, I felt it worth mentioning.


I didn't take it as an "admonition against using such study aids", but more a warning not to treat the test as something that could or should be the scene for mass memorization of kanji and vocabulary.

I'd be willing to do the manual labor myself on this if needed. :)

<!-- Entry for Kanji: 亜 -->
<character>
<literal>亜</literal>

... >8 snip >8 ...

<misc>
<grade>8</grade>
<stroke_count>7</stroke_count>
<variant var_type="jis208">48-19</variant>
<freq>1509</freq>
<jlpt>1</jlpt> ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← ← :!:
</misc>

... and so on...


If the codes are to be changed in KANJIDIC, I need to strip all the existing codes from the database and add new ones. What I use for updating is a file like:

亜 1
阿 1
哀 1
愛 2
葵 1
茜 1
悪 3

A big caveat here is that I will only change the existing codes if there is a strong case that the replacements are really appropriate for the current JLPT structure. And I haven't a clue how you establish that. This is not just a TJP thing.

Cheers

Jim
User avatar
jimbreen
 
Posts: 165
Joined: Tue 06.27.2006 2:09 am
Location: Melbourne, Australia

Re: Question for Jim Breen et al about KANJIDIC2

Postby phreadom » Sun 12.04.2011 9:06 pm

jimbreen wrote:A big caveat here is that I will only change the existing codes if there is a strong case that the replacements are really appropriate for the current JLPT structure. And I haven't a clue how you establish that. This is not just a TJP thing.


Totally understandable. There is a very limited amount of information available so far as to what exactly goes into each level of the new test structure... and from the way they make it sound, none is going to be forthcoming beyond what used to be available for the old tests before the official spec was released... information melded together from many years worth of past tests to get a general idea.

I think if I'm going to offer the kanji as a new format N5 - N1 formatted study list, I'll have to just custom create that data myself for local use for the time being (maybe with a little disclaimer about it being rough still and subject to change). Not a problem. :)

Thank you for your response! :bow:
猿も木から落ちる
User avatar
phreadom
Site Admin
 
Posts: 1762
Joined: Sun 01.29.2006 8:43 pm
Location: Michigan, USA
Native language: U.S. English (米語)
Gender: Male


Return to Japanese Language Proficiency Test

Who is online

Users browsing this forum: No registered users and 3 guests