■BigQueryの列レベル・鐔??レベルのセキュリテ繧?
BQ画面・??左ナビのポリシータ繧?
ポリシータグを作成(組織単位で臀??括臀??覧表示・??
タグは髫?層化できるので、全ユーザタグ・??管理者タグ・??社長タ繧?
スキーマ>Addポリシータ繧?
タグが付いていればプレビューで鐔??れない
select * except(tag_column)にする必要がある
メタデータは鐔??れる(カラム名、型
ポリシータグ画面・??対象ポリシー選択>情報パネルで権限者一隕?
fine-grained readerを付荳?する縺?select *ができるようになる
社長タグに社長だけ権限付ける等
窶?APIを有効にし、ポリシーを有効にする必要がある
■承鐔??済みビュ繝? authorized view
authorized viewを設藹??するとそ縺?viewを対象とする権限だけ必要で権限をさかのぼり付荳?しな縺?ていい(通常縺?viewは藹??照元の権限も必要)
この権限移譲は閲覧権限のみで編集権限等は含まない
被藹??照の元テーブル側に許可するview名を設藹??する
藹??照権限は緩縺?なるが、編集権限は厳し縺?なる(設藹??するビューは藹??更しない前觸??で承鐔??する形・??
authorized viewを付荳?すると軆??関となったビュー縺?dataEditorではビュー更新ができな縺?なる
ソーステーブルにもdataOwnerが必要(通常のビュー臀??成に縺?dataViewerがソースに藹??要)
基本の藹??全軆??縺?authorized view設藹??を外す>ビュー藹??更・??AV再設藹??がいい
対象縺?AVは管理者を立て臀??元管理するのが良さそう
(テーブルやビューを作って権限付荳?してバッチだ縺?data ownerが必要なのは注意)
■Authorized系にはメリットとデメリット
1) Authorized viewを設藹??するメリット
一度設定してしまえばソース側への権限付荳?依頼が不要となりビューの権限管理が省力化できる
ビューにて閲覧対象を絞ることができソース全臀??は閲覧させないことができる、絞れる
普通のビューは元データへの権限が必要で鐔??せた縺?ないデータへも権限が必要になる場合がある2) Authorized viewを設藹??するデメリット
一度設定してしまえばソース側での権限付荳?依頼が不要となり被藹??照側で許可臀??許可の判断ができな縺?なる、誰にデータ閲覧権限を付荳?しているか把握できず管理が機能しな縺?なる一面がある
将来に置かれるソース側のデータの閲覧も許可することになり不用諢?に閲覧が可能となってしまう
terraform縺?Authorized view設藹??が剥がれてしまう危険諤?
ビューを編集するにあたりAuthorized viewを外す必要がある、あるいはソースにもEditor権限
すぐにビューを変更することができな縺?なる(ビューを一旦削除することはできる)
Authorized viewはビューを削除して、再度臀??り直すと生きている場合がある、ダメな場合も多いが
これで觸??洩させた縺?ない情報を一時含められる危険性がある
3)authorized datasetを設藹??するデメリット
設藹??時は良いかもしれないが、将来的に諢?図しないデータがDS入った場合も閲覧を許してしまう
↓
データセットは細かく作成してアクセスレベル設定し普通のビューを使う
ソース全臀??を閲覧させられない場合(直接権限を付荳?できない場合)縺?AVを使うメリットがでる
情報觸??洩リスクはどちらも多段ビューで同じ感じ、だがビュー臀??成縺?AV設藹??が生きているバグがデカい
GAでな縺?、またオンデマンドしか無理、コピペやデータコネクタは可能で觸??蠢?
■ロール割り当て者の出力
カスタムロール縺?Project_Admin、Project_Managerが誰に割り当てられているか
Asset inventoryをBQにダンプしたデータからクエリする
WITH
projects AS (
SELECT
resource.data AS rsc,
ancestor_path
FROM
prj.cloud_asset_inventory.cloud_asset_inventory_org_resource_now
WHERE
asset_type = 'cloudresourcemanager.googleapis.com/Project'
),
projects_info AS (
SELECT
JSON_EXTRACT_SCALAR(rsc, '$.projectId') AS projectid,
JSON_EXTRACT_SCALAR(rsc, '$.lifecycleState') AS lifecycleState,
ancestor_path
FROM
projects
),
projects_efficient AS (
SELECT
*
FROM
projects_info
WHERE
NOT REGEXP_CONTAINS(ancestor_path, "folders/apps-script")
),
projects_num_adm_mgr AS (
SELECT
REPLACE(name, '//cloudresourcemanager.googleapis.com/projects/', '') AS project_num,
REPLACE(b.role, 'organizations/1234567/roles/', '') AS role_value,
STRING_AGG(REPLACE(m, 'user:', ''), ', ') AS member_value
FROM
prj.cloud_asset_inventory.cloud_asset_inventory_org_iam_policy_now,
UNNEST(iam_policy.bindings) AS b,
UNNEST(b.members) AS m
WHERE
asset_type = 'cloudresourcemanager.googleapis.com/Project'
AND (role LIKE '%Project_Admin%' OR role LIKE '%Project_Manager%')
GROUP BY
project_num,
role_value
),
projects_adm_mgr AS (
SELECT
JSON_EXTRACT_SCALAR(resource.data, '$.projectId') AS project,
projects_num_adm_mgr.role_value,
projects_num_adm_mgr.member_value
FROM
projects_num_adm_mgr
LEFT JOIN
prj.cloud_asset_inventory.cloud_asset_inventory_org_resource_now AS res
ON
projects_num_adm_mgr.project_num = REPLACE(res.name, '//cloudresourcemanager.googleapis.com/projects/', '')
)
SELECT
projects_efficient.projectid,
projects_efficient.lifecycleState,
CONCAT(projects_efficient.projectid, ', ', projects_adm_mgr.role_value) AS role_value,
projects_adm_mgr.member_value
FROM
projects_efficient
LEFT OUTER JOIN
projects_adm_mgr
ON
projects_efficient.projectid = projects_adm_mgr.project
ORDER BY
lifecycleState DESC,
projectid;
■BigQuery DataFrames + Geminiでデータ分析
from google.cloud import bigquery
from google.generativeai import GenerativeModel
bq_client = bigquery.Client()
# クエリ藹??行し縺?DataFrame藹??得
query = "SELECT customer_review FROM `my_project.my_dataset.reviews` LIMIT 10"
df = bq_client.query(query).to_dataframe()
# Geminiモデルの觸??備
model = GenerativeModel("gemini-pro")
summaries = []
for review in df["customer_review"]:
response = model.generate_content(f"次のレビューを要約して縺?ださい: {review}")
summaries.append(response.candidates[0].text) # 修正: 正し縺?レスポンスを藹??得
# DataFrameに鐔??約を追加
df["summary"] = summaries
table_id = "my_project.my_dataset.review_summaries"
job = bq_client.load_table_from_dataframe(df, table_id)
job.result()
print("データをBigQueryに臀??存しました!")
■BigQuery ML (bqml_llm_infer) + Geminiで感情分析
from google.cloud import bigquery
bq_client = bigquery.Client()
# クエリ藹??行し縺?DataFrame藹??得
query = """
SELECT
bqml_llm_infer(
model_name => 'my_project.my_dataset.gemini_model',
prompt => CONCAT('このレビューの感情分析をして縺?ださい: ', customer_review)
) AS sentiment_analysis
FROM `my_project.my_dataset.reviews`
LIMIT 10
"""
df = bq_client.query(query).to_dataframe()
print(df)