IT業界の仕事とは/莫大なデータを整頓管理・有効活用~データベースエンジニア編
身近にたくさんの分野がありすぎて、
ITとは、なんて言われても一問一答できないこの世界。
どんな分野があって、具体的にどんな仕事をしているのかを
業界初心者が同じ目線で職業レポートしていくシリーズです。
大まかなタイプ分けをしてみましたので、
流し読みしていただけると把握しやすいかもしれません↓
このページの内容
データとは
データを扱うエンジニアの役割
データベースについて
使われる知識や技術
データベースエンジニアの役割
データを有用情報化するエンジニア
データとかデータベースとかって聞いても、
そもそもどういうものかピンと来ない...
って思いませんか。
そもそもデータとは
データとは例えば、
・ブログやSNSで言えば、投稿内容・ユーザー情報・コメント
・ネット上に公開されている動画・音声・画像
・ショッピングサイトの閲覧履歴や購入履歴など
・お店でレジをした時の取引データ
・会社の業務で作られた文書やメール、使われているツール
・企業が開発した製品情報、企業の顧客情報...
種類は細かく分けられているようですが、
こういったものはすべてデータです。
そして、企業がうまいこと立ち回って事業を続けていくには、
データの収集・分析とそれに沿った戦略が必要になります。
事業は、自分たちの持てる力を使って
ものやサービスを届けていくもの。
どんな人が、どんなものを必要としているのか、
気に入ってくれるか、選んでくれるのか...
などをデータから分析し、
自分たちの製品を欲してくれる人に
届けられる方法を考えないといけません。
それをどうしていくか、という事業の方針を決めるために、
データを扱える人というのはとっても重要なんですね。
そしてデータベースとは、
データをしまっている倉庫みたいなもので、
必要な時に探しやすいように整理整頓されています。
データベースエンジニア
データもデータベースも、そこにあるだけでは
ただのデータです。
どんなデータを集め、抽出し、どう分析に使うのか...
そうして初めて、データは有用な”情報”になります。
データを有用な”情報”として扱えるようにするための
システムを開発するのが、データベースエンジニアのお仕事です。
データベースの形態
一般的に、従来から使われてきた形は、
「リレーショナルデータベース」というものです。
行と列でできた、エクセルの表みたいな形です。
データを操作する時には、「SQL(エスキューエル)」という
プログラミング言語を使います。
そして、それ以外の形で管理されているものを、まとめて
「NoSQLデータベース」と呼ばれています。
”No”はNot onlyの略で、
SQLを使わないのではなく、SQLだけ使うんじゃないよ、
という意味だそうです。
グラフやタグ付けのような、
色々な形式でデータを管理できます。
例えばゲームなど、追加更新情報が多い、
見る・使う人が多いもの、高速処理してほしいものは、
こっちのNoSQLの方が適しているといいます。
扱うのがリレーショナルデータベースなのか、
NoSQLデータベースなのかで技術が異なり、求人も別のよう。
細かいポジション
上記のSQLを使ってリレーショナルデータベース(表形式)にアクセスし、
データからレポートを作るためのプログラムを書く、
「SQLプログラマ」というポジションがあるそう。
プログラムを書くので、データベース以外に
プログラミングの知識も要りますね。
言語はJavaやPythonなどを使うようです。
また、部門ごとに分けられたデータベースから必要なデータを取り出し、
加工して一か所にまとめる、「ETLプログラマ」というポジション。
例えば、工場での生産管理・在庫管理・営業管理などで
別種類のデータを違うデータベースで管理していた時、
その全部のデータの中から問題点を見つけて、
メインのデータベースに収納するなど。
ETLは、
E:抽出(エクストラクト)、加工(トランスフォーム)、収容(ロード)
の頭文字だそうですよ。
他にも、データの構造設計に特化したポジションや
データの全体的な構成を設計・実装するポジションもあるようですが、
上記のSQLプログラマ、ETLプログラマなどと
境目があやふやだったり、兼務していたりするようです。
知識や技術
リレーショナルデータベース(表形式)ですと、前述しましたが、
データ操作にSQLという言語が使われるようです。
S:構造化(ストラクチャー)された、Q:問い合わせ(クエリ)、L:言語(ランゲージ)
の略です。
余談ですが、日本ではエスキューエルと読み、
英語ではシークルと読むそう。
ツールとしては、
Oracle、MySQL、PostgreSQL、Microsoft SQL Serverなど。
Oracleは、「エステー」「象印」「UQコミュニケーションズ」「ニッセイ」など。
MYSQLは、「Yahoo!」「Google」「Nokia」「YouTube」
などで採用されているそうですよ。
リレーショナルデータベース以外のNoSQLであれば、
Redis、Amazon DynamoDB、Google Big Table、MongoDB、Neo4j
など。
アルファベットばかり並んで見づらいですが、
これらはデータベース上のデータを管理するための
ソフトウェアの名前です。
それと、データからレポートを作る、SQLプログラマであれば
プログラミング言語としてJavaやPython。
他ページにも記載しているので見飽きてたら申し訳ないですが、
Java↓
PCゲーム、ECサイト、Webサイト、TwitterなどSNS、Androidアプリが作れる
Python↓
AI、家電に組み込むプログラム、Google、Dropbox、Instagram、PinterestなどWebアプリ
といった感じで開発に使われている言語です。
ですので、データベースエンジニアの仕事をしたいとなった場合は、
上記のようなプログラミング言語・ソフトウェアについての知識を
習得することになります。
分かりやすく資格もそれぞれ用意されているようなので、
それに沿った教材で勉強できそうですb
ということで、今回のレポートは以上です。
今更ですが、”データ”とかいう目に見えない概念を
府に落とすのに難儀しますね。
インスタに投稿した猫の写真とか、投稿したブログ記事とか、
こういうものであればとても身近なんですが...
なかなかこれ基準では、必要なデータ抽出!分析!とか
言われてもピンと来ないですし。
お店で働いた経験があれば、販売している商品情報とか、
購入してくれたお客さんの顧客情報、
売れた商品の情報、値引きやイベントの情報、
修理、メンテナンスした情報、
入荷した商品に関する情報なんかが
イメージしやすいでしょうか。
紙面に残しているとバックヤードが膨れ上がっていくやつですね。
企業は、事業を通していかに役に立つか、
自分たちのできる役割を果たすかを考えなければなりません。
そうして誰かに貢献できて、得た利益を循環させて、
世の中のしくみは動いているんですね。
データを活用することによって、
必要としている人に必要な製品やサービスを
届けられる確率が格段に上がり、
そうして助かる人もたくさん増えることでしょう。
ということで、今回のレポートは以上です。
それではまた!
この記事の投稿者
入社間もない採用アシスタント兼広報担当。
学歴高卒/完全未経験で拾っていただき、日々勉強しながら&調べながら発信中。
とりあえずITパスポートは入社後3週間ちょいで取得済。
趣味は絵とカラオケと自転車(眺める専)、九州の実家には拾った猫3匹&カメ1匹が鎮座。
参考にさせていただいた書籍やサイト(敬称等略)
情報処理エンジニア職業ガイド / 豊沢 聡 / 大間 哲 ◎共著
https://www.internetacademy.jp/it/server/database.html
https://products.sint.co.jp/topsic/blog/nosql
https://www.ashisuto.co.jp/case/product/oracle/
https://it-trend.jp/database/article/89-0065