Pythonで正規表現:電話番号

郵便番号については既に議論した。次は電話番号行を特定するための正規表現である。
電話番号行は
行の先頭が’電話’、’Tel’、’TEL’で始まる文字列の行(例:電話022-222-4444)。または0から9の半角数字、記号’-‘、記号'(‘、記号’)’の文字からのみなる文字列(例:022(222)2345や022-227-2345)とする。
この条件をPythonで書くと:


#coding: utf-8
import re
msgs = ['電話022-222-2222', 'Tel022-222-2345', 'TEL022-228-5678', \
        '022(2267)5678', '234-3456-4567', '456局345(65678)','34+456+4567']
for i, msg in enumerate(msgs):
    m1 = re.search(r'^電話|Tel|TEL', msg)
    #print(i, m1)
    m2 = re.search(r'[^0-9-()]', msg)
    #print(i, m2)
    if bool(m1) or not bool(m2):
        print(msg, ' OK')
    else:
        print(msg, ' NG')

m1は文の先頭に’電話’等の文字列があることを条件にしている。m2は当該の位置にない文字を指定している。つまり、0から9まで半角数字、記号’-‘、記号'(‘、記号’)’以外のものがあるとマッチする。文字列のどこかに該当する文字があるとマッチする1文字マッチの条件である。m2にはその文字が代入される。その文字列の最後まで探して該当する文字がないとm2はNoneになる。つまり、除外した文字のみでできている文字列であるかどうかを判定できる。

結果は
電話022-222-2222 OK
Tel022-222-2345 OK
TEL022-228-5678 OK
022(2267)5678 OK
234-3456-4567 OK
456局345(65678) NG
34+456+4567 NG
となる。

Pythonによる正規表現はここが詳しい。

内蔵の助(くらのすけ)谷と佐々成政(ささなるまさ)

黒部渓谷、岳、立山連峰周辺の地図を眺めていると「長次郎谷」、「源次郎尾根」、「作朗越」など人の名前に由来すると思われるものが地形の名前に使われていることがある。これらはこの周辺の山を案内した地元の案内人の名前であるが、「内蔵の助谷」と古風な名前の谷がある。これは現在の「黒四ダム」の少し下流で左岸に流れ込んでいる谷である。

この谷の名前は古風なはずで戦国時代の武将の名前に由来する。その武将は佐々内蔵之助成政という。天正12年(1584年)、越中を支配していた成政が越中から信州に出て、浜松まで行き家康に面会したとされるときに通過したルートが、「早月入りを伊折から大窓を越えて立山の東面に入り、内蔵の助平の岩窟で泊まり、内蔵の助谷を下った」という伝説があるという(「黒部渓谷」)。

黒部渓谷の阿曽原(アゾハラ)

黒部渓谷の中流域に阿曽原(アゾハラ)という地名がある。この地名の由来について「黒部渓谷」(冠松次郎著)に記載があった。それによれば「湯の湧き出る熱いところ」の意味だそうだ。事実こに地域は黒部渓谷のなかでも最も湯が湧き出る量が多いところの一つで、熱湯が川に流れ込むところがいく筋があるという。

現在ではここには温泉山小屋があって「高熱隧道」(吉村昭著)で「胞雪崩」で倒壊した宿舎跡地にその温泉山小屋は建っている。

利便性vs.多様性:ディジタル化で失われるもの

利便性が高いとディジタル化が叫ばれている。

ディジタル化で失われるものもある。それが多様性だ。

ものごとのディジタル化に際して規格化がされる。規格化は篩いにかけることである。篩いの目が粗いと篩いに残ったものは質が均質で扱いやすくディジタルシステムの利便性は大きくなる。しかし篩いの目からこぼれてしまったものも多い。これがものごとの多様性を担っている部分である。

利便性だけを追い求めるとますます多様性が失われる。

熟旨(じゅくうま)と曙光(しょこう)

熟旨(じゅくうま)と曙光(しょこう)も台所にあった食品に付けられていた商標である。

熟旨にはかなが振ってあって「じゅくうま」と読ませる。曙光は「しょこう」とかなが振ってある。

曙光(しょこう)が音だけで読ませるのに対して、「熟旨(じゅくうま)は最初の漢字は音で、二番目は訓で読ませる。じゅくうま」はいわゆる重箱読みである。熟旨は音だけで読むと「じゅくし」となる。こちらの方が美味しそうかな。

泥縄窯(どろなわかま):名前が面白い

今朝の新聞の「ひと」欄には、タイトルのような面白い名前の窯で焼しめで陶器を作っている中島浩文さんが紹介されていた。

陶器の町佐賀県武雄(たけお)市でその泥縄窯の窯元として釉薬(うわくすり)を使わない焼し締めという方法で陶器を製作している。焼き締めの面白さは「窯を開いたときに、思いかけないものができていることがある」と語っている。

東北大学片平キャンパス周辺のメタセコイア

米ヶ袋の広瀬川の岸辺近くには珪化木となったメタセコイアが沢山見られる。下の写真はその一つである。近くにある説明板によると約300万年まえに大量の火山灰に埋もれたメタセコイアである。

珪化木となったメタセコイア

片平キャンパスには沢山メタセコイアが植えられている。下の写真は旧理学部生物棟近くに植えられたメタセコイアの大木である。

旧理学部生物棟のメタセコイア

右の建物が旧理学部生物棟(通称赤レンガ)である。このメタセコイアは嘗て米国から東北大学に贈られた三本の苗木の一つの成長したすがたと思われる。

構内にはメタセコイアが並木に植えられているとことが幾つかある。下の写真は構内北門近くにあるメタセコイアの並木である。

メタセコイアの並木

近くにある案内板の説明によればこの並木は前の写真の旧理学部生物棟にあったメタセコイアから挿し木として移植されたものである。メタセコイア(あけぼの杉)と書いてあった。

メタセコイア発見から80年:身近な「生きた化石」

今日の朝刊のコラム「気になるサイエンス」の記事のタイトルである。

仙台にはメタセコイアの木が沢山生えている。

東北大学川内キャンパスにあるメタセコイアの並木

このメタセコイアは現生種より化石が先に発見された。発見者は三木茂博士。いまから80年前のことである。博士は約1千万年前から100万年の地層で後にメタセコイアと命名される針葉樹の葉付き枝や球果の化石を発見し、これが現生のセコイアやスマスギの仲間と違う特徴を持っていることを確認。今は絶滅した「未知の植物」であるとしてメタセコイアと命名した。後に中国で現生種が発見され日本にも導入された。

三木博士が教鞭をとっていた大阪学芸大学(現在の大阪市立大学)の植物園はメタセコイアの日本のメッカである。

LibreOffice7.1を使ってみる

PowerPCのMacで使えたオフィス系のフリーソフトにLibreOffice4.0があった。そのMacを諦めてwindowsに移行した。LibreOfficeで作った資料も移行したがwindowsにあるMicrosoftのオフィス系のソフトでこの資料が読み込めないことが判明。

その対策としてLibreOfficeの最新版ではMicrosoftへの対応が改善されているかもしれないと思い、windowsにLibreOfficeの最新版7.1.2をインストールして使ってみた。

結論から言うとLibreOfficeの最新版は非常によくできていて、MicrosoftのOfficeは全く必要ない。

最近のMicrosoftのOfficeはLibreOfficeのデータを読み込めるようになっているという。互換性の面でもLibreOfficeの使用には問題なした。

LibreOfficeは

  • Writer:文書処理
  • Calc:表計算
  • Draw:図形描画
  • Math:数式表示処理
  • Impress:プレゼンテーション
  • Base:データベース

の6個のソフトウエアからなっている。特にWriter, Calc, Draw そしてMathの間のシームレスな統合処理は印象的である。さらにマクロ処理にPythonも使えることは面白いと思った。

簡単な統合処理の例を以下に示す:

Libre_sample

 

黒部・立山関連の文庫本

黒部立山アルペンルートの開通の記事を読んでいたら、以前かなり熱心に黒部立山関連の本を読んでいたことを思い出した。本棚を眺めて見つけたのが以下の文庫本である:

  • 「黒部渓谷」(冠松次郎著:平凡社)

黒部渓谷に本格的に人の手が入るまえの渓谷を跋渉した記録である。大正から昭和初期の黒部渓谷の様子がわかる。

  • 「劔岳 点の記」(新田次郎著:文春文庫)

劔岳山頂に三角点を設置する目的で未踏峰の登頂を遂げた測量員の物語。

  • 「高熱隧道」(吉村昭著:新潮文庫)

黒部第三発電所建設に必要な軌道トンネル・水路トンネル掘削は温泉湧出地帯の難工事であった。昭和11年ごろの話。

「黒部の太陽」(黒部第四発電所)も読んだが興味が持てず文庫本は手放してしまった。