2016年9月14日水曜日

Python | 画像ファイルのExif情報を取り出す

普段デジカメで写真を撮ることが多いので、遠くない将来、撮りためた画像のExif情報から自分の傾向分析なんかをすることになる気がしています。

その時のために、画像ファイルのExif情報をPythonで書いたスクリプトを使って取得する方法を調べてみました。

ネットで検索すると、PIL(Python Image Library)というモジュールを使っている例が多いようなのですが、使い方がいまいちピンとこなかったので、別の方法として、ExifReadを使ってみることにしました。

ExifReadをDLする

ExifReadはこちらからDLできます。


モジュールを適切な場所に置く

解凍したモジュール一式を僕は"C:\Python27\Lib"の中に置きました。

スクリプトを書く

下を参考にしてみてください。
僕はこのサイトに教えてもらいました。

---
#!/usr/bin/env python
#-*- coding:utf-8 -*-

# 目的
# 画像ファイルからExif情報を取り出す

# 使い方
# 1.このスクリプトファイルを画像データのあるフォルダに置く
# 2.必要に応じて拡張子の指定部分を書き換える
# 3.実行する

from exif_py_develop import exifread
import glob

photos = glob.glob('*.JPG')

for f in photos:
    fname = open(f,'rb')
    tags = exifread.process_file(fname)

    for tag in tags:
        if tag not in ('JPEGThumbnail', 'TIFFThumbnail', 'Filename', 'EXIF MakerNote'):
            print "Key: %s, value %s" % (tag, tags[tag])
---

実行結果

スクリプトファイルは画像ファイルと同じフォルダに置いて実行します。
Exifにはたくさんの情報が入っていますが、例えば撮影日時であれば

Key: EXIF DateTimeDigitized, value 2016:08:24 16:44:22

2016年8月24日16時44分22秒に撮影された、と出力されます。

注意点やメモ

  • DL,解凍したモジュールを最初にインポートしています。
  • フォルダ内の全画像ファイル(拡張子JPG)を取得するのにglob関数を使いましたので、globモジュールもインポートしています。このとき、拡張子の指定は文字列で、大文字小文字も区別されます。

2016年7月7日木曜日

Python | for文での繰り返しを降順(逆順)で回す

for文では通常、指定範囲の中でインデックスの値の小さい方から大きい方へ向かって処理が進みますが、この方法で問題となるのが、スプレッドシートなどで条件に合う行を削除する場合です。

スプレッドシートで1行削除すると行の位置が1つ上にずれてしまい、本来削除したい行とはずれが生じてしまいます。

それを解決するのが、スプレッドシートの下のほうの行から上に向かって行の削除を実行していく方法になります。この方法のスクリプトはこちらを参考にしてください。PythonではなくGoogle Apps Scriptで書いたものですが、イメージは伝わるかと思います。

ここで問題となるのが、Google Apps Script(JavaScript)のfor文で"--i"、つまり i = i -1 で表現している、降順でのループの回し方を、Pythonの文法でどう表現するのか、ということです。

結論としては、

for i in range(1, 10):

のような書き方のforループを逆順で回す場合、

for i in reversed(range(1, 10)):

とします。

2016年6月10日金曜日

Python | 複数の画像ファイルをWordの表に貼りつける方法

Microsoft Wordの表の1セルに1コマずつ、複数(多数)の画像ファイルを貼りつける場面があり、手動ではかなりの時間がかかったため、効率化をのためのメモを残しておきます。

前提として、全画像ファイルが同一フォルダに置かれているものとします。また、画像ファイルの入っているフォルダには、画像ファイル以外にはPythonスクリプトファイルのみ置かれているものとします。

#---
#!/usr/bin/env python
# -*- coding: UTF-8 -*-

import os
import win32com.client as win32

def insertImagesIntoWord(arg):

    wordApp = win32.gencache.EnsureDispatch('Word.Application') #create a word application object
    wordApp.Visible = 1 # Wordを表示します
    doc = wordApp.Documents.Add() # create a new application

    doc.PageSetup.RightMargin = 15 # Wordのページの右側余白を指定します
    doc.PageSetup.LeftMargin = 15 # Wordのページの左側余白を指定します
    doc.PageSetup.Orientation = win32.constants.wdOrientLandscape
    # A4 サイズ: 595x842
    doc.PageSetup.PageWidth = 595
    doc.PageSetup.PageHeight = 842

    total_column = 3 # Wordの表の列数を指定します
    total_row = 17 # Wordの表の行数を指定します
    rng = doc.Range(0,0)
    rng.ParagraphFormat.Alignment = win32.constants.wdAlignParagraphCenter
    table = doc.Tables.Add(rng,total_row, total_column)
    table.Borders.Enable = False
    if total_column > 1:
   table.Columns.DistributeWidth()

    frame_max_width= 167 # the maximum width of a picture
    frame_max_height= 125 # the maximum height of a picture

    for index, filename in enumerate(filenames):

        if filename[len(filename)-4: len(filename)].upper() == 'JPEG':

# 各画像を貼りつける位置を計算します
cell_column= index % total_column + 1
cell_row = index / total_column + 1

# セルの形式を整えます
cell_range= table.Cell(cell_row, cell_column).Range
cell_range.ParagraphFormat.LineSpacingRule = win32.constants.wdLineSpaceSingle
cell_range.ParagraphFormat.SpaceBefore = 0
cell_range.ParagraphFormat.SpaceAfter = 3

# ここで画像を貼りつけています
current_pic = cell_range.InlineShapes.AddPicture(os.path.join(os.path.abspath("."), filename))
width, height = (frame_max_height*frame_max_width/frame_max_height, frame_max_height)

# 画像の大きさを表のセルサイズに合わせる場合はこちらも追加します
#current_pic.Height= height
#current_pic.Width= width

# 各セルに対応する画像のファイル名を入力します
table.Cell(cell_row, cell_column).Range.InsertAfter("\n"+filename)


if __name__ == "__main__":

    currentDir = os.getcwd() # スクリプト実行時のカレントディレクトリのパスを取得します
    filenames = os.listdir(currentDir)
    insertImagesIntoWord(filenames)
#---

こちらがベースです。
ファイルがJPG形式かどうかを確認する部分の書き方がくどく感じますが、これで当初の目的はほぼ果たせました。


2016/07/15追記
対象のフォルダ内に画像ファイルとスクリプトファイル以外のファイルが存在すると、画像の貼り付けが表の左上からではなく、ずれてしまいます。

2015年11月10日火曜日

Windowsダイアログを使って編集するファイルを指定する方法2 | Python

テキストファイルの指定行頭に"$"を追記し、指定外の行はオリジナルのまま別ファイルに書き出すことを考えます。"$"をつけた行は読み込まれなくなるものとして、関数名はcommnetOutとしています。

---以下スクリプト---

import win32ui
import os.path

# Windowsダイアログを作ります
o = win32ui.CreateFileDialog( 1, ".inc", "", 0, "Text Files (*.inc)|*.inc|All Files (*.*)|*.*|")
o.DoModal()

# ダイアログで指定したファイルのパスを取得して変数inFileに割り当てます
inFile = o.GetPathName()

def commentOut():

    try:
        # ファイルの保存先とファイル名を指定するダイアログを作ります
        o = win32ui.CreateFileDialog( 1, ".inc", "", 0, "Text Files (*.inc)|*.inc|All Files (*.*)|*.*|")
        o.DoModal()
        # ファイル保存先のパスを取得して変数outFileに割り当てます
        outFile = o.GetPathName()

        fin = open(inFile,"r")
        line_list = fin.readlines()

        fout = open(outFile,"w")

        #コメントアウトしたいスタート行番号を指定します
        start_line = 646189
         #コメントアウトしたい最終行番号を指定します
        end_line = 652848

        #読み込んだテキストファイル全行が入ったリストの最初から最後まで繰り返します
        for index,line in enumerate(line_list):
            if start_line-2 < index < end_line:
                fout.write("$" + line)
            else:
                fout.write(line)

        fout.close()
        fin.close()

    except:
        pass

    finally:
        pass

if __name__ == "__main__":
    commentOut()

---以上スクリプト---

以前の投稿で書いたWindowsダイアログの作り方とは別の書き方となっていますが、操作結果は同じようなものになります。

2015年11月6日金曜日

Windowsダイアログを使って編集するファイルを指定する方法1 | Python

Excelファイルでのデータ処理をPythonで記述したスクリプトを使って行う場合を想定します。

---
import win32com.client

xlApp = win32com.client.Dispatch("Excel.Application")
xlApp.Visible = 1

xlApp.Workbooks.open(r"C:\training\test.xlsx")
xlSheet = xlApp.Workbooks(1).Sheets(1)

xlCell = xlSheet.Cells(2,1)
xlCell.Value = "aaa"
---

これを実行すると新規にExcelが起動し、セルA2にaaaが入力されます。

次に、Windowsのダイアログから開きたいファイルを指定する方法です。

---
import win32com.client
import win32ui #ダイアログを開くために追記します

o = win32ui.CreateFileDialog( 1, ".txt", "default.txt", 0, "Text Files (*.txt)|*.txt|All Files (*.*)|*.*|")
o.DoModal() #( )内はダイアログ上の表示を規定しています

xlApp = win32com.client.Dispatch("Excel.Application")
xlApp.Visible = 1

xlFile = o.GetPathName() #ダイアログで指定したファイルのパスを変数xlFileに入れています

xlApp.Workbooks.open(xlFile)
xlSheet = xlApp.Workbooks(1).Sheets(1)

# A2セルにaaaと書き込む
xlCell = xlSheet.Cells(2,1)
xlCell.Value = "aaa"
---

これでダイアログから開きたいファイルを指定することができます。

ファイル名は隠しています


しかし、問題もあります。
それは、ダイアログでキャンセルボタンが押された時の処理が書かれていないことです。
これについての対応方法は別の投稿で書きたいと思います。

2015年10月27日火曜日

Python | リストのインデックスと値を同時に取得する

テキストファイルの指定行をコメントアウトする作業をPythonで自動化することを考えます。
ここでは、コメントアウトする方法として行頭に"$"を付けることにします。

処理の流れを書き出すと、


  1. コメントアウトしたい行(スタート行とエンド行)を指定しておく
  2. テキストファイルの全行をリストに格納する
  3. リストに格納した行の内容を順番に書き出す
  4. 1.で指定した行に達したら、行頭に"$"を付けて書き出す作業をエンド行まで繰り返す
  5. エンド行より後の行からはリストに格納した内容のまま書き出す
---
    start_line = 9 #コメントアウトしたいスタート行番号
    end_line = 641739 #コメントアウトしたい最終行番号

    for index,line in enumerate(line_list):
        if start_line-2 < index < end_line:
            savefile.write("$" + line)
        else:
            savefile.write(line)
---

この時、行番号とリストのインデックスが対応するため、enumerate()関数でリストの中身とインデックスを同時に取得しています。

2015年8月21日金曜日

オンラインでGoogle Apps Scriptを学ぶ方法 | schoo(スクー)

オンライン学習サービスの1つであるschoo(スクー)をご存じでしょうか?

様々な分野の講義・講座の動画が配信されていて、生放送と録画があります。
生放送では、授業配信サイトを開いたウェブブラウザ上で講師への質問や生徒同士のやり取りをリアルタイムにチャットのようにすることができるのが特徴で、逆に講師側から生徒への質問もあります。

様々な授業の中に、初心者向けGoogle Apps Scriptによるプログラミング講座があります。
現在録画で受講することができるものとして、例えば、

Google Apps Script 入門 -基礎知識編-
Google Apps Script 入門 -Google Spread Sheet編-

があります。

先日はForm編の生放送がありましたので、後日録画配信されるものと思います。

録画版は内容に応じて無料のものと有料(チケット制)のものがあるため、過去の全ての授業を受けられるわけではありませんが、SNSやメールを通じて招待した友人が受講登録することでチケットがもらえたりしますので、興味のある方は一度サイトを覗いてみてはいかがでしょうか。

僕は通勤で片道1時間程度、電車に乗っているため、通勤時間中に受講することでかなり有効に時間を使えるようになったと感じています。

SyntaxHighlighter