MIS 180 Midterm #2 MEADER Study Guide sa sa sa sa sa sa
structured data - sa sa sa
sa ✔️~Facts (name, order number, quantity, location, time) sa sa sa sa sa sa
~Questionnaire / Survey data (1-5, coded) sa sa sa sa sa
~Bibliographic info about unstructured data sa sa sa sa
~Online behavior (clicks, views, links, game moves)
sa sa sa sa sa sa
~Constructed data (sentiment, mood, intent) sa sa sa sa
~Metadata (data about data) sa sa sa
*easier for businesses to process because it is a set piece of information rather than something more
sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa
similar to human language
sa sa sa sa
unstructured data - sa sa sa
sa ✔️~Emails
~Voice messages sa
~Texts, tweets sa
~Social media sa sa
~Video / Audio / Photo sa sa sa sa
Big Data - sa sa sa
sa ✔️~Name given to the increasingly HUGE collection of data captured from the world
sa sa sa sa sa sa sa sa sa sa sa sa
~Structured Data and Unstructured Data sa sa sa sa
~From all sorts of inputs (cameras, microphones sensors, devices - like Alexa!, vehicles, drones, online
sa sa sa sa sa sa sa sa sa sa sa sa sa sa
activity)
sa
4 V's -
sa sa sa
sa ✔️1) Velocity - the speed at which new data are gathered and stored
sa sa sa sa sa sa sa sa sa sa sa sa
2) Variety - the variety of the kinds of new data
sa sa sa sa sa sa sa sa sa sa
3) Volume - the sheer quantity of data being gathered and stored
sa sa sa sa sa sa sa sa sa sa sa
4) Veracity - the increasing difficulty of assessing quality information
sa sa sa sa sa sa sa sa sa
,These describe the data now being gathered and stored. We still have to figure out how to manage it,
sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa
analyze it, and use it.
sa sa sa sa sa
Why we should avoid using spreadsheets to store important data and instead use a database
sa sa sa sa sa sa sa sa sa sa sa sa sa sa
management system? -
sa sa sa sa
sa ✔️Spreadsheets lead to... sa sa
~Unnecessary duplication - data redundancy sa sa sa sa
~Inconsistent data - data inconsistency sa sa sa sa
~Difficult to do efficient data retrieval and search - data isolation
sa sa sa sa sa sa sa sa sa sa
~Easy to get access to it - data insecurity
sa sa sa sa sa sa sa sa
~Easy to make errors - data errors
sa sa sa sa sa sa
~All leading to.....Poor data integrity
sa sa sa sa
accurate - sa sa
sa ✔️correct in all details; exact. sa sa sa sa
complete - sa sa
sa ✔️All necessary information must be given
sa sa sa sa sa
consistent - sa sa
sa ✔️Steady; regular sa
timely - sa sa
sa ✔️Information that is available to decision-makers before it loses its capacity to influence decisions.
sa sa sa sa sa sa sa sa sa sa sa sa sa
accessible - sa sa
sa ✔️easy to approach; obtainable
sa sa sa
data redundancy -
sa sa sa
sa ✔️Unnecessary duplication of information (similar names, same address, phone number) sa sa sa sa sa sa sa sa sa
, data inconsistency -
sa sa sa
sa ✔️Inconsistent data sa
data isolation -
sa sa sa
sa ✔️Difficult to do efficient data retrieval and search
sa sa sa sa sa sa sa
data insecurity -
sa sa sa
sa ✔️Easy to get access to it
sa sa sa sa sa
database - sa sa
sa ✔️refers to the stored data and all the files that contain that data
sa sa sa sa sa sa sa sa sa sa sa sa
database management system - sa sa sa sa
sa ✔️includes the database, AND also includes the system software, applications, and other system
sa sa sa sa sa sa sa sa sa sa sa sa
sa parts that let us USE the database
sa sa sa sa sa sa
Advantages:
~Data are located on a centrally accessible server
sa sa sa sa sa sa sa
~Data quality and access are controlled by dedicated professionals
sa sa sa sa sa sa sa sa
~Possible for everyone to access the data they need
sa sa sa sa sa sa sa sa sa
**Result: Data are easier to find, easier to maintain, easier to ensure data quality
sa sa sa sa sa sa sa sa sa sa sa sa sa
data value -
sa sa sa
sa ✔️An actual piece of information, at the smallest level.
sa sa sa sa sa sa sa sa
Example: "Mickey" for first name, "Mouse" for last name
sa sa sa sa sa sa sa sa
instance - sa sa
sa ✔️one particular record
sa sa
structured data - sa sa sa
sa ✔️~Facts (name, order number, quantity, location, time) sa sa sa sa sa sa
~Questionnaire / Survey data (1-5, coded) sa sa sa sa sa
~Bibliographic info about unstructured data sa sa sa sa
~Online behavior (clicks, views, links, game moves)
sa sa sa sa sa sa
~Constructed data (sentiment, mood, intent) sa sa sa sa
~Metadata (data about data) sa sa sa
*easier for businesses to process because it is a set piece of information rather than something more
sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa
similar to human language
sa sa sa sa
unstructured data - sa sa sa
sa ✔️~Emails
~Voice messages sa
~Texts, tweets sa
~Social media sa sa
~Video / Audio / Photo sa sa sa sa
Big Data - sa sa sa
sa ✔️~Name given to the increasingly HUGE collection of data captured from the world
sa sa sa sa sa sa sa sa sa sa sa sa
~Structured Data and Unstructured Data sa sa sa sa
~From all sorts of inputs (cameras, microphones sensors, devices - like Alexa!, vehicles, drones, online
sa sa sa sa sa sa sa sa sa sa sa sa sa sa
activity)
sa
4 V's -
sa sa sa
sa ✔️1) Velocity - the speed at which new data are gathered and stored
sa sa sa sa sa sa sa sa sa sa sa sa
2) Variety - the variety of the kinds of new data
sa sa sa sa sa sa sa sa sa sa
3) Volume - the sheer quantity of data being gathered and stored
sa sa sa sa sa sa sa sa sa sa sa
4) Veracity - the increasing difficulty of assessing quality information
sa sa sa sa sa sa sa sa sa
,These describe the data now being gathered and stored. We still have to figure out how to manage it,
sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa sa
analyze it, and use it.
sa sa sa sa sa
Why we should avoid using spreadsheets to store important data and instead use a database
sa sa sa sa sa sa sa sa sa sa sa sa sa sa
management system? -
sa sa sa sa
sa ✔️Spreadsheets lead to... sa sa
~Unnecessary duplication - data redundancy sa sa sa sa
~Inconsistent data - data inconsistency sa sa sa sa
~Difficult to do efficient data retrieval and search - data isolation
sa sa sa sa sa sa sa sa sa sa
~Easy to get access to it - data insecurity
sa sa sa sa sa sa sa sa
~Easy to make errors - data errors
sa sa sa sa sa sa
~All leading to.....Poor data integrity
sa sa sa sa
accurate - sa sa
sa ✔️correct in all details; exact. sa sa sa sa
complete - sa sa
sa ✔️All necessary information must be given
sa sa sa sa sa
consistent - sa sa
sa ✔️Steady; regular sa
timely - sa sa
sa ✔️Information that is available to decision-makers before it loses its capacity to influence decisions.
sa sa sa sa sa sa sa sa sa sa sa sa sa
accessible - sa sa
sa ✔️easy to approach; obtainable
sa sa sa
data redundancy -
sa sa sa
sa ✔️Unnecessary duplication of information (similar names, same address, phone number) sa sa sa sa sa sa sa sa sa
, data inconsistency -
sa sa sa
sa ✔️Inconsistent data sa
data isolation -
sa sa sa
sa ✔️Difficult to do efficient data retrieval and search
sa sa sa sa sa sa sa
data insecurity -
sa sa sa
sa ✔️Easy to get access to it
sa sa sa sa sa
database - sa sa
sa ✔️refers to the stored data and all the files that contain that data
sa sa sa sa sa sa sa sa sa sa sa sa
database management system - sa sa sa sa
sa ✔️includes the database, AND also includes the system software, applications, and other system
sa sa sa sa sa sa sa sa sa sa sa sa
sa parts that let us USE the database
sa sa sa sa sa sa
Advantages:
~Data are located on a centrally accessible server
sa sa sa sa sa sa sa
~Data quality and access are controlled by dedicated professionals
sa sa sa sa sa sa sa sa
~Possible for everyone to access the data they need
sa sa sa sa sa sa sa sa sa
**Result: Data are easier to find, easier to maintain, easier to ensure data quality
sa sa sa sa sa sa sa sa sa sa sa sa sa
data value -
sa sa sa
sa ✔️An actual piece of information, at the smallest level.
sa sa sa sa sa sa sa sa
Example: "Mickey" for first name, "Mouse" for last name
sa sa sa sa sa sa sa sa
instance - sa sa
sa ✔️one particular record
sa sa