AI

๋จธ์‹ ๋Ÿฌ๋‹ ์•ผํ•™ - 2์ผ์ฐจ

๋…ธ๋ฃจ๋ฃฝ 2021. 1. 5. 03:19

์ถœ์ฒ˜: https://opentutorials.org/course/4548/28891

์ง์—…์˜ ์‹œ์ž‘

๋งŒ์•ฝ, ๋ ˆ๋ชจ๋„ค์ด๋“œ ์นดํŽ˜๋ฅผ ์šด์˜ํ•œ๋‹ค๊ณ  ๊ฐ€์ •.

์˜ค๋Š˜ ๋ช‡ ์ž”์˜ ๋ ˆ๋ชจ๋„ค์ด๋“œ๊ฐ€ ํŒ”๋ฆด์ง€ ์˜ˆ์ธกํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด?

์˜จ๋„์™€ ํŒ๋งค๋Ÿ‰์„ ๋ฐ์ดํ„ฐ๋กœ ํ‘œํ˜„ → ํ˜„์‹ค์„ ๋ฐ์ดํ„ฐ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ!

 

ํ˜„์‹ค์„ ๋ฐ์ดํ„ฐ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜๋งŒ ์žˆ๋‹ค๋ฉด, ์ปดํ“จํ„ฐ๋Š” ์—„์ฒญ๋‚œ ํž˜์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด์ฒ˜๋Ÿผ ๋ณต์žกํ•œ ํ˜„์‹ค์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ฐพ์•„๋‚ด ํ˜„์‹ค์„ ๋ณ€ํ™”์‹œํ‚ค๋Š” ๊ฒƒ '๋ฐ์ดํ„ฐ ์‚ฐ์—…'

 

๋ฐ์ดํ„ฐ ์‚ฐ์—…์€ ํฌ๊ฒŒ 2๊ฐ€์ง€๋กœ ๋‚˜๋‰œ๋‹ค.

  • ๋ฐ์ดํ„ฐ ๊ณผํ•™(Data Science): ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“ค๊ณ , ์ด์šฉํ•˜๋Š” ์ผ. (์ฑ…์— ๋น„์œ ํ•œ๋‹ค๋ฉด, ์ž‘๊ฐ€)
  • ๋ฐ์ดํ„ฐ ๊ณตํ•™(Data Engineering): ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๋„๊ตฌ๋ฅผ ๋งŒ๋“ค๊ณ , ๋„๊ตฌ๋ฅผ ๊ด€๋ฆฌํ•˜๋Š” ์ผ.
                                              (์ฑ…์— ๋น„์œ ํ•œ๋‹ค๋ฉด, ์ข…์ด, ์—ฐํ•„, ์ฑ…์„ ๋งŒ๋“œ๋Š” ๊ฒƒ)

์ด ๋‘˜์€ ํ•œ์ชฝ์ด ์—†์œผ๋ฉด ๋‹ค๋ฅธ ํ•œ์ชฝ์ด ์กด์žฌํ•  ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์‹ค์€ ํ•˜๋‚˜์ด๋‹ค.

 

ํ‘œ

์ถœ์ฒ˜: https://opentutorials.org/course/4548/28928

ํ‘œ๋Š” ํ–‰๊ณผ ์—ด๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„.

์—‘์…€, DB ๊ฐ™์€ ๋„๊ตฌ์— ํ‘œ๋ฅผ ์˜ฎ๊ฒจ๋‹ด์œผ๋ฉด ์ปดํ“จํ„ฐ๊ฐ€ ๋น ๋ฅด๊ฒŒ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ.

 

ํ‘œ๋Š” ๋ฐ์ดํ„ฐ๋“ค์˜ ๋ชจ์ž„ == ๋ฐ์ดํ„ฐ ์…‹(Data Set)์ด๋ผ๊ณ ๋„ ๋ถ€๋ฅธ๋‹ค.

์ถœ์ฒ˜: https://opentutorials.org/course/4548/28928

๋ฐ์ดํ„ฐ ์‚ฐ์—…์—์„œ๋Š” ํ–‰๊ณผ ์—ด์ด๋ผ๋Š” ํ‘œํ˜„ ๋Œ€์‹  ๋‹ค๋ฅธ ํ‘œํ˜„์„ ์‚ฌ์šฉ.

  • ํ–‰(row)
    • ๊ฐœ์ฒด(instance)
    • ๊ด€์ธก์น˜(observed value)
    • ๊ธฐ๋ก(record)
    • ์‚ฌ๋ก€(example)
    • ๊ฒฝ์šฐ(case)

 

  • ์—ด(column)
    • ํŠน์„ฑ(feature)
    • ์†์„ฑ(attribute)
    • ๋ณ€์ˆ˜(variable)

 

๋…๋ฆฝ๋ณ€์ˆ˜์™€ ์ข…์†๋ณ€์ˆ˜

 

์‹ฌ๋ฆฌ์ „